継続的にDatachemical LABの機能を充実させています。今回は仮想サンプル生成において、新たな機能が追加されました。プレスリリースはこちらです。
材料設計やプロセス設計において、実験条件・合成条件・評価条件・プロセス条件などの特徴量 x と材料の物性・活性・特性 y との間で数理モデル y = f(x) を構築するとき、まだ実験データがないときには最初に実験する x のサンプルを考える必要があります。Datachemical LAB では、データ解析・機械学習によってモデルを構築することを前提として、良好なモデルが得られやすいように、x のサンプルを提案する機能があります。さらに、Datachemical LAB では、モデルを構築した後に、まだ実験していない x の大量のサンプルをモデルに入力して y の値を予測し、予測結果に基づいて次に実験するべきサンプルを提案する機能もあります。ベイズ最適化で次の実験条件を決めることもできます。
以上のような、最初に実験するサンプルの提案や、既存のデータに基づいて構築されたモデルによる次の実験条件の提案のときに重要となるのが、仮想的なサンプルの大量生成です。
実験条件・合成条件・評価条件・プロセス条件には様々な制約があります。温度・圧力などの上限や下限が決まっていたり、原料の組成などのように合計値が決まっていたりします。また複数の添加剤から、いくつかの種類のみを選んで使用し、さらに添加剤の合計の範囲が決まっていたりします。また、科学者の知見やこれまでの経験によって、条件の間で複雑に関連しあった制約を考慮したいこともあります。Datachemical LAB において、様々な制約条件を考慮して、仮想的なサンプルを大量に生成できるようになりました。
Datachemical LAB では、例えば以下のような状況における仮想サンプル生成に対応できます。
- 特徴量の上限と下限を設定したい
- 特徴量のもつ値の種類を制限したい
- いくつかの特徴量の合計値を一定にしたい
- 合計値に範囲をもたせたい
- 合計値を一定にしたり、範囲をもたせたりする特徴量の種類を変えながらサンプルを生成したい
さらに、以上の項目を組み合わせることで、多種多様な x の仮想サンプルを大量に生成できます。
Datachemical LAB で生成された x のサンプルで実際に実験し、その後に実験結果 y を用いて数理モデル y = f(x) を構築したり、y が良好になる x のサンプルを、大量に生成した候補の中から選択したりすることが、すべて Datachemical LAB によって達成できます。
興味がありましたら、以下のウェブサイトからお問い合わせいただけますと幸いです。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。