機械学習モデルの議論において、まずモデルが何を表すか明確にすると良いと思います！

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。

上の文章におけるモデルは、すべてのパラメータが既知の一つの数式を表します。簡単な例でいえば、y = 3x₁ + 2x₂ – 5 といった感じです。もちろん、モデル = (パラメータが与えられた)数式、で問題ありません。この場合、パラメータが変われば、モデルも変わったということになります。

ただ一方で、モデル関係の議論の中で、モデルをある種の「形式」と捉えている方もいます。例えば、モデルを、回帰分析手法とする考え方もあります。感じです。同じ回帰分析手法を用いても、データセットが変われば (例えば適応的実験計画法でサンプルが一つ追加されれば)、数式内のパラメータも変わります。すなわち、数式のパラメータは変わっても、モデルは変わらない、というスタンスです。もちろん、モデルの考え方的に問題はありません。ちなみに、適応型ソフトセンサーのモデルでは、

適応型ソフトセンサーで産業プラントにおけるプロセス状態等の変化に対応する (Adaptive Soft Sensor)

化学プラント・産業プラントにおいて、測定することが難しいプロセス変数の値を、コンピュータでリアルタイムに推定するため、ソフトセンサーが活用されています。“ソフトセンサー” とかっこいい名前がついていますが、結局はあるいくつかのプロセス変数 ...

[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」の“改訂版の発行にあたって”、詳細な目次、第８章の一部

2023 年 8 月 30 日に、金子弘昌著の「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」が出版されました。オーム社: Amazon: こちらは、以前に出版した書籍「化学のための Pythonによるデータ解析・機...

新たに測定されたサンプルが追加され、モデル構築用のデータセットに追加されるたび、数式のパラメータも変わります。モデルは同じにもかかわらず、数式が変わる例ですね。

他にも、適応的実験計画法のときに、例えばベイズ最適化をするために、ガウス過程回帰を用いると、

[無料公開] 「Pythonで学ぶ実験計画法入門ベイズ最適化によるデータ解析」の “まえがき”、目次の詳細、第１・２章

2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門ベイズ最適化によるデータ解析」が出版されました。講談社: Amazon: Amazon(Kindle): === 出版して約２年経過した 2023 年 4 月 ...

ガウス過程回帰という手法をモデルと捉えると、実験が進んでサンプルが増えて数式を再構築しても、モデルは変わらないことになりますが、ガウス過程回帰によって構築される数式自体をモデルと捉えると、実験が進んでサンプルが追加されることにモデルが変わることになります。さらに言えば、サンプルが増えることにガウス過程回帰のカーネル関数の種類も最適化すれば、数式のパラメータだけでなく、数式の形も変わることになります。これを、モデルを数式としてモデルが変わったと捉えるか、モデルはガウス過程回帰と捉えて変わっていないと捉えるか、これは人によって異なります。ガウス過程回帰とカーネル関数の組み合わせをモデルと捉える人もいるかもしれません。このようにモデルの捉え方の違いによって、場合によっては議論が噛み合わないことがあります。

他にも、例えば

特徴量の種類
特徴量選択 (変数選択) の有無
外れ値処理の有無
転移学習の有無
(スペクトルの場合の) 平滑化の有無
(スペクトルの場合の) 微分の有無
・・・

など、それぞれの組み合わせをモデルとする考え方もあります。また、例えば特徴量選択において、各手法や手法におけるパラメータの値の差異をモデルに含めるか否かによっても、何をモデルとするかも変わります。機械学習モデルに関する議論をしているとき、議論が噛み合わなくなった場合は議論している人たちがそれぞれ何をモデルと考えているか、まずは確認するとよいと思います。

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。