データ化学工学研究室 (金子研) では、基本的に化学データ・化学工学データを用いて、データ解析・統計解析・機械学習によって、数理モデル・数値モデル (人工知能) を作ったり、それを有効に使ったりする研究をしています。
人工知能を作ところのイメージは、こちらに示したとおりです。
人工知能を活用して、有益な情報や知見を獲得したり、新たな分子の化学構造や、分子や材料を創るための実験条件・製造条件などを設計したりもしています。
何もないところから、意味のある人工知能を作ることはできません。もちろんデータを使って人工知能を作ることになるのですが、適当なデータでは、意味のある人工知能は作れません。
では、どんなデータが必要になるか、そして人工知能が本質的に何をしているのか、考えてみたいと思います。人工知能がしていることは、形式的には、データの中に潜むパラメータ間の関係を抽出していること、といえます。ではこれから何を意味するのでしょうか。
たとえば高機能材料の設計として、実験条件を変えながら、目標を満たす材料を作るための実験条件・製造条件を決めることを考えます。このような状況において、実験をする研究者が高機能材料を作るために、その人のもつ情報・知識・知見・経験、ときには勘、を使って、次の実験条件・製造条件を考え、実験をしています。その結果として、材料が作られ、その物性や活性の値が測定され、一つのデータになるわけです。もちろん一人の研究者だけでなく、複数の研究者によって、このような実験が行われます。そのため、集まったデータの中には、たくさんの研究者の実験者の情報・知識・知見・経験・勘がつまっています。
もちろん、このようなデータを見ただけでは、研究者たちがどうして、どのような思考の結果、そのような実験をしたのか理解することは、つまり研究者の情報・知識・知見・経験・勘を把握することは難しいでしょう。人工知能を作るということは、そのようなデータの中から、研究者の情報・知識・知見・経験・勘を抽出している作業といえます。
その高機能性材料や材料を作るプロセスにはサイエンスがあり、材料パラメータ・実験パラメータの間には (すべてのパラメータが手元にあることが前提ですが)、何らかの関係性があります。実際には、その関係性はわからないことが多いですが、研究者たちはそのサイエンスを把握しようといろいろと調査したり、自分で考えたり、考えたことを実験で検証したりしているわけです。もちろん、実際は一人だけでなく複数の人たちが (同じ場所もしくは別の場所で) 研究しています。そのような研究者たちの考えたことが、データに反映されているわけです。つまり研究者たちの考えた “サイエンス” がデータに存在しているのです。人工知能を作るというのは、そのサイエンスを抽出していることなのです。
作られた人工知能を使うというのは、過去の実験結果を再現させたり、いろいろな研究者の情報・知識・知見・経験・勘がつながった結果をチェックしたりすることに対応します。もしくは、少しだけ情報・知識・知見・経験・勘を外挿させます。その結果、有用な (目標の物性値に近づく) 材料が得られたらうれしい!、というわけです。
人工知能が勝手にやってくれる??
ちなみに、実験計画法・適応的実験計画法 ((Adaptive) Design of Experiments, DoE) とかResponse Surface Methodology (RSM) とかベイズ最適化 (Bayesian Optimization, BO)では、
上のようにして作られた人工知能を用いて、目標の物性値を達成する確率が最大となるような実験条件・製造条件を見つけようとしています。将棋とか将棋とかのようにシミュレーションで新たなデータを取れる系もありますが基本的には、実験と組み合わせることが必要です。
結局、人工知能でやっているとことは、このような単純なことです。人工知能とはうまく付き合うことが大切と思います。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。