材料設計やプロセス設計において、合金や高分子などの複数の原料を混合するプロセスを経て得られる材料を設計することがあります。材料の特徴量や材料を合成・製造するプロセスの特徴量 x と、材料の物性・活性・特性 y との間で、データセットを用いて数理モデル y = f(x) を構築します。モデルを用いて x の値から y の値を予測したり、y が目標値になるような x を設計したりします。
数理モデルを構築するときに重要なことは、適切に x を準備・設計することです。材料の特徴量を、金属元素やモノマーなどの原料の特徴量とその組成を用いて計算することがあります。
例えば、原料の特徴量を原料の組成を用いて重み付け平均した値を、材料の特徴量として使用するとき、原料の特徴量としてカタログ値などの原料の物性値を用いる場合や、原料の構造や種類から計算できる特徴量を用いる場合があります。既存の原料の中から選択すればよいときは、それらの原料において共通して分かっている物性値を特徴量として用いることができますが、物性値が不明な原料や仮想的に存在する構造を含めて設計したい場合には、原料の特徴量として原料の物性値を使用することはできません。
ただ、このような場合でも物性値を活用する方法があります。
一つは、原料のデータセットを用いて、原料の特徴量を x’、原料の物性を y’ として数理モデル y’ = g(x’) を構築します。物性値が未知の原料に対して、モデルを用いて x’ から y’ を推定し、その推定値を、材料における原料の特徴量として使用します。これにより新しい原料に対しても、推定値ではありますが物性を考慮した材料の x を計算できます。
もう一つは、原料の特徴量の選択に物性を用いる方法です。特に原料の特徴量 x’ が多いとき、組成で重み付けしても材料の物性や活性 y とは関係のない特徴量が存在する場合もあります。原料の物性が、合成された材料において重要なとき、原料の物性と関係のある特徴量 x’ を使用することで、コンパクトなモデル y = f(x) を構築できます。
原料の物性 y’ と原料の特徴量 x’ の間で、例えば Boruta などで変数選択・特徴量選択を行い、選択された特徴量のみを用いて、材料の特徴量 x を計算します。
以上のように、新たな原料を設計する場合でも、原料の物性を有効に活用できます。数理モデルの予測精度を向上させる一つの作戦として、ぜひ取り組んでみてください。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。