y-randomization(y-scrambling)の結果が悪いとき、どうすればいいのか? 回帰モデルやクラス分類を構築したいとき、扱うデータセットごとに適した手法は異なるため、今のデータセットに適した手法を選択するため、手法ごとの予測性能を評価します。トレーニングデータとテストデータに分けて、トレーニングデータで構築されたモデル... 2021.11.21 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
手法や手段を目的化しないように気をつけましょう!~データ解析・機械学習が目的ではありません~ データ解析・機械学習によって分子設計・材料設計・プロセス設計などを効率化する試みがあります。例えば、目的変数 (物性・活性・製品品質など) y と説明変数 (実験条件・合成条件・プロセス条件など) x との間で、既存のデータセットに基づいて... 2021.11.14 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
プロセス状態ごとに異なる重要なプロセス変数とその動特性を考慮した適応型ソフトセンサーEGAVDS-LWPLSを開発しました![金子研論文] 金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルはAdaptive soft sensor ensemble for selecti... 2021.11.07 データ解析プロセス制御・プロセス管理・ソフトセンサー研究室論文
転移学習におけるモデルの適用範囲 転移学習にも色々とありまして、例えばディープニューラルネットワークを用いて、ソースドメインのデータセット (サポート用のデータセット) でネットワークを学習させておいて、中間層における最後の層のニューロンだけターゲットドメインのデータ (目... 2021.10.31 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
クロスバリデーションとダブルクロスバリデーションの整理 言葉の似ているクロスバリデーションとダブルクロスバリデーションですが、意味合いが異なります。目的の違いとして、クロスバリデーションの目的は PLS における主成分の数や SVR における C, ε, γ といったハイパーパラメータを最適化す... 2021.10.31 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
ガウス過程回帰におけるyの予測値の分散を検証する方法 金子研オンラインサロンにおいて、ガウス過程回帰において、予測値の分散が正しく評価されているのか、どのように検証したらよいか?、といった質問があり、回答しました。ガウス過程回帰の予測値の分散は、モデルの適用範囲やベイズ最適化にも活用され、気に... 2021.10.24 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
低次元化を駆使して直接的逆解析法の予測精度を向上させる手法を開発しました![金子研論文] 金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルはLifting the Limitations of Gaussian Mixtu... 2021.10.17 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
事実と解釈を分けて考える (モデルの解釈の話ではありません) 研究に関する議論をしたり、研究発表を聞いたり自分でしたり、研究論文を読んだり自分で書いたりするときに気をつけていることの一つとして、事実と解釈を分けて考える、ということがあります。例えば回帰モデルの予測精度の話で、あるモデルを用いてテストデ... 2021.10.17 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
r2, RMSE, MAE は手法やモデルを比較するための指標です 講演会や金子研オンラインサロンにおいて、よくある質問の中に、 r2 はいくつ以上だったら良いモデルですか? RMSE や MAE がいくつ以下だったら良いモデルですか?といったものがあります。結論からいえば、r2, RMSE (Root-M... 2021.10.10 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
データセットの空欄を埋める方法 データセットにおいて、空欄があるときがあります。すべてのサンプル、そしてすべての特徴量に値が準備されているわけではなく、穴あきのデータセットということです。データ解析や機械学習をするためには、まずこの空欄を埋める必要があります。もちろん場合... 2021.10.03 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室