説明変数の上限・下限はデータ解析・機械学習では決まりません!決めるときは実験系・シミュレーション系で!

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。

x の値の設計をするための一般的なモデルの逆解析では、まず x に上限・下限を決めて、その範囲内で乱数に基づいて x の候補を生成します。このとき、場合によっては x に制約を設定し、その制約を満たす候補のみ生成します。次に、生成した候補をすべてモデルに入力し、y の値を予測します。そして、 予測結果が良好な候補を選択します。ベイズ最適化では、y の予測値の代わりに、獲得関数の値が良好な候補を選択します。

[無料公開] 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 の “まえがき”、目次の詳細、第1・2章
2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」が出版されました。 講談社: Amazon: Amazon(Kindle): === 出版して約2年経過した 2023 年 4 月...

 

ここで最初に決める上限・下限は、データ解析や機械学習では決まりません。実験系における装置の制約や材料の制約などによって、上限・下限を決めます。他にも、ドメイン知識を使い、たとえば合成可能な候補になるように制約を決めることもあります。

もし、上限・下限がないようなとき、実験系・シミュレーション系で決められないときには、かなり大きな値として上限・下限を設定するか、モデルの直接的逆解析が有効です。

モデルの直接的逆解析法で効率的な適応的実験計画法ができるようになりました![金子研論文]
金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルは Adaptive design of experiments based on ...

 

モデルの直接的逆解析では、y を入力すると x に制約を設けることなく x の値が計算されます。もちろん、モデルの直接的逆解析において、あえて x に制約を設定することも可能です。

Gaussian Mixture Regression の真の順解析・逆解析をする手法を開発しました![金子研論文]
金子研の論文が Science and Technology of Advanced Materials: Methods に掲載されましたので、ご紹介します。タイトルは True Gaussian Mixture Regression a...

 

ぜひ、ご自身の実験系やシミュレーション系の範囲内で x の設計を実施していただければと思います。

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました