プロセス制御・プロセス管理・ソフトセンサー

ガウス過程回帰におけるyの予測値の分散を検証する方法

金子研オンラインサロンにおいて、ガウス過程回帰において、予測値の分散が正しく評価されているのか、どのように検証したらよいか?、といった質問があり、回答しました。 ガウス過程回帰の予測値の分散は、モデルの適用範囲やベイズ最適化にも活用され、 ...

低次元化を駆使して直接的逆解析法の予測精度を向上させる手法を開発しました![金子研論文]

金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルは Lifting the Limitations of Gaussian Mixt...

事実と解釈を分けて考える (モデルの解釈の話ではありません)

研究に関する議論をしたり、研究発表を聞いたり自分でしたり、研究論文を読んだり自分で書いたりするときに気をつけていることの一つとして、事実と解釈を分けて考える、ということがあります。例えば回帰モデルの予測精度の話で、あるモデルを用いてテストデ...

r2, RMSE, MAE は手法やモデルを比較するための指標です

講演会や金子研オンラインサロンにおいて、よくある質問の中に、 r2 はいくつ以上だったら良いモデルですか? RMSE や MAE がいくつ以下だったら良いモデルですか? といったものがあります。結論からいえば、r2, RMSE (Root-...

データセットの空欄を埋める方法

データセットにおいて、空欄があるときがあります。 すべてのサンプル、そしてすべての特徴量に値が準備されているわけではなく、穴あきのデータセットということです。データ解析や機械学習をするためには、まずこの空欄を埋める必要があります。もちろん場...

データセットを解析したり新たな手法を開発したりする時にチェックしていること

データ化学工学研究室 (金子研) では、いろいろなデータセットを解析したり、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスの新たな手法を開発したりしています。そのようなとき、共通する内容として、主に以下の...

データ解析や構築したモデルの目的によって特徴量や手法は異なる

データセットを準備して、説明変数 x と目的変数 y との間で回帰モデルやクラス分類モデル y = f(x) を構築して、そのモデルを活用する、といったことはあります。このときモデルの予測精度は非常に重要です。予測精度を向上させるために、x...

特徴量間の関係をすべて考慮してモデリングしたいならGMM

回帰分析やクラス分類では、説明変数 x と目的変数 y があり、x と y の間でモデル y = f(x) を構築します。モデルを用いて、x を入力して y を予測したり、y が目標値になるような x を設計したりします。ここでは、いろいろ...

データセットに不要な特徴量があることよりも、重要な特徴量がないことの方が問題です

説明変数 x と目的変数 y の間のモデル y = f(x) について、モデルの予測精度を向上させようとするとき、x の特徴量の検討は非常に重要です。データ収集のときに適切な特徴量のデータを集めたり、データ収集後に特徴量を適切に変換したりす...

測定条件・分析条件・評価条件の異なる物性や活性のデータの扱い

説明変数 x と目的変数 y の間で、機械学習によりデータセットからモデル y = f(x) を構築することがあります。y として物質の物性や活性が用いられますが、例えば温度や圧力といった、物性や活性の測定条件・分析条件・評価条件が異なるデ...
タイトルとURLをコピーしました