モデルの「予測性能」とは?ーテストデータをどの程度予測できるかだけではありません!

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。

モデルとして「予測性能」の高いものが望まれており、サンプル、x、モデル構築手法などの検討が行われます。一般的にモデルの予測性能というと、トレーニングデータとテストデータに分割し、テストデータをどの程度予測できるかを指すことが多いです。回帰分析でしたら決定係数R2、RMSE、MAEなど、そして実測値と予測値のプロット、クラス分類であれば正解率、精度、検出率、F値など、そして混同行列で評価します。

決定係数r2、MAE、正解率などの統計量の扱いには注意しましょう
分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y =...

 

サンプルが少ない時は、トレーニングデータ・テストデータ分割の代わりにダブルクロスバリデーションを用いることもあります。

[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」の“改訂版の発行にあたって”、詳細な目次、第8章の一部
2023 年 8 月 30 日に、金子弘昌著の「化学のためのPythonによるデータ解析・機械学習入門(改訂2版)」が出版されました。オーム社: Amazon: こちらは、以前に出版した書籍 「化学のための Pythonによるデータ解析・機...

 

もちろん、モデルを使用する目的が「トレーニングデータと近いデータをなるべく正確に予測すること」であれば、モデルの「予測性能」の評価としてトレーニングデータ・テストデータ分割やダブルクロスバリデーションだけで十分です。

一方で、モデルを使用する目的が「なるべく広範囲のデータを高い精度で予測すること」であれば、モデルの適用範囲の広さもモデルの「予測性能」の一つの指標となります。

モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) ~回帰モデル・クラス分類モデルを使うとき必須となる概念~
今回は、モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) についてです。AD は回帰モデル・クラス分類モデルが本来の性能を発揮できるデータ領域のことです。回帰モデル・クラス分類モデルを使うとき必須にな...

 

モデルの適用範囲が広いほど「予測性能」は高いと言えます。モデルの適用範囲の広さを評価する方法については、こちらに記載した通りです。

モデルの適用範囲の広さを評価する方法
分子設計・材料設計・プロセス設計・プロセス制御において、分子記述士・合成条件や製造条件・プロセス条件・プロセス変数などの特徴量 x と材料の物性・活性・特性や製品品質などの目的変数 y との間で、数理モデル y = f(x) を構築します。...
モデルの適用範囲を広げるにはどうすればよいのか?
分子設計・材料設計・プロセス設計を行うとき、分子記述子や材料の合成条件・製造条件やプロセス条件などの特徴量 x と物性・活性・特性など y との間で、データを用いて数理モデル y = f(x) を構築します。そして、そのモデルを用いて x ...

 

また、モデルの適用範囲と予測誤差を合わせた評価についても、こちらに書いたように可能です。

モデルの適用範囲の手法やハイパーパラメータの選び方
説明変数 x と目的変数 y の間で構築されたモデル y = f(x) を運用するとき、モデルの適用範囲 (Applicability Domain, AD) が必須になります。AD は、モデルが本来の予測性能を発揮できる x のデータ範囲...
モデルの適用範囲を設定する手法とそのハイパーパラメータを最適化する手法を開発しました![金子研論文]
金子研の論文が ACS Omega に掲載されましたので、ご紹介します。タイトルはEvaluation and Optimization Methods for Applicability Domain Methods and Their ...

 

さらに、モデルの目的が「外挿を高精度に予測すること」であれば、外挿の予測誤差もモデルの「予測性能」の一つになります。外挿についてはこちらに書いた通りであり、

「外挿」は、特徴量ベース?化合物ベース?化合物の組み合わせベース?
分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y =...
「外挿を予測できる」とは?―仕組みの話?高精度?
分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y =...
外挿領域を予測するときの心構え
分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y =...

 

また外挿の予測誤差の評価方法も、こちらに記載したように可能です。

モデルがどれくらい外挿できるか (モデルの適用範囲の外をどのくらい予測できる) の検証方法
回帰モデルでもクラス分類モデルでも、モデルを構築したら、そのモデルでどれくらいの外挿ができるか、つまりモデルの適用範囲 (Applicability Domain, AD) の外をどのくらい予測できるのか、はとても大事です。AD はモデルが...

 

このように「モデルの予測性能」と言っても様々な視点から語られるため、構築するモデルの目的に応じて適切に評価することが重要です。モデル自体やモデルの目的が特殊な場合には、評価方法から考える必要があることもあります。ぜひ、モデルを用いる目的に応じて適切に予測性能を議論していただければと思います。

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました