同じ実験条件で繰り返し実験するのは、最後だけでよいのでは?~(適応的)実験計画法のススメ~

高機能性材料の研究・開発をするとき、材料の合成条件等の実験条件を変えながら実験し、結果を確認します。もちろん再現性も大事なので、同じ実験条件で繰り返し実験します。3 回や 5 回が多いと思います。いわゆる n = 3, n = 5 です。ただ、最終的に高機能生材料を開発することを目指したとき、実験計画法、そして適応的実験計画法を活用することで、どの実験条件でも毎回 3 回も 5 回も実験する必要はなく、むしろその回数の実験コストを、実験条件を振って実験することに回し、再現性の確認は材料としての目標を達成する見込みが得られてからのみ実施するすことで、効率的に材料開発をすることが可能です。

例えば A, B, C, D を何らかの化合物として、化学反応 A + B → C + D における C の収率を上げることを考えます。収率が最も高くなる実験条件を見つけることが目標となります。

実験条件の 1 つである反応温度を 25℃ にして実験することを考えます。一般的には、同じ実験条件で何回か、例えば 3 回実験します。

もちろん、他の反応温度の値のほうが収率は高くなる可能性があります。そこで 25 ℃だけでなく、別の反応温度の値にして実験します。例えば、反応温度が 20 ℃, 30 ℃, 35 ℃, 40 ℃, 45 ℃, 50 ℃の場合でも実験します。(25 ℃を合わせて) 7 通りの反応温度がありますので、実験の回数は 3 × 7 = 21 回となります。

さらに、反応温度だけでなく、反応時間や触媒に種類も変更すると、収率がより高い実験条件がある可能性があります。反応時間・触媒の種類もそれぞれ 7 通りあるとすると、反応温度・反応時間・触媒の種類について、すべての実験条件の組み合わせで実験すると、実験の回数は 3×7×7×7 = 1029回もの数になります。すべて実験するのは現実的ではありません。

ここで考え方を変えます。もちろん、収率が最も高くなる実験条件を探索することが最終的な目標ですが、その前の目標として、下のモデルを求めることを目標にします。

 

収率 = f(反応温度、反応時間、触媒の種類)

 

f は何らかの数式であり、「化学反応モデル」と名付けます。f に反応温度の値・反応時間の値・触媒の種類を入力すると、収率の値が出力されます。このモデルがあれば、反応温度・反応時間・触媒の種類を変えたときに収率がどうなるか、実験せずに確認できます。化学反応のシミュレーションができるわけです。そして、シミュレーションの結果、収率が最も高い実験条件で、実際に実験することが可能となります。

以上の化学反応の例のように、高機能性材料を開発するための実験をすることがあります。実験をするときは、どのような原料を使用するか、それぞれの原料をどのくらい用いるかをはじめとして、いろいろな実験条件をあらかじめ決める必要があります。実験レシピを決めるわけです。目的の高機能性材料を作るための実験レシピがわからないときは、実験条件をいくつか振って実験します。実験条件の数が多いとき、そして実験条件ごとに候補の値もしくは種類が多いときには、すべての組み合わせで実験するのは現実的ではありません。なるべく少ない実験回数で目的の高機能性材料を作るための実験レシピを効率的に探したいわけです。

このとき、実験条件 x と、実験結果 y との間で、モデル y = f(x) を構築することを考えます。このモデルがあれば、x の値を入力して y の値を計算することが、実験をしなくても可能です。そのため、例えば 100 万通りのような、たくさんの x の値の候補をモデルに入力することで y の値を計算し、その計算された y の値が良好な x の値を選択する、といったこともできます。実験なしに、目的の高機能性材料を作るための実験レシピを効率的に探せるわけです。

ここでは、モデル y = f(x) が重要です。なるべく良好な (予測精度の高い) モデルが必要です。良好なモデルを構築できるように、最初に実験すべき適切な x の候補を決める方法が、実験計画法 (Design of Experiments, DoE) です。実験計画法によって提案された実験条件で実験し、y を測定することで x と y のデータセットを作成し、モデル y = f(x) を構築すれば、y の値が良好になるような次の実験条件を、モデルから提案できます。提案された実験条件での実験結果が、y の目標を達成していれば終了となりますが、達成していなければ、実験結果をデータセットに追加して、再度モデル y = f(x) を構築します。モデル構築、新たな実験条件の提案、実験、実験結果のデータセットへの追加を繰り返しながら、y の目標を達成する材料を作るための実験条件を探索することを、適応的実験計画法 (adaptive DoE) もしくは能動学習 (active learning) と呼びます。

同じ実験条件で繰り返し実験して再現性を確認するのは、適応的実験計画法や能動学習で y の目標を達成できる目処がたってからでよいでしょう。

実験計画法、適応的実験計画法、能動学習について学びたい方、実際に実施してみたい方は、以下の書籍がオススメです。

[無料公開] 「Pythonで気軽に化学・化学工学」 の “まえがき”、目次の詳細、第1・2・3章
2021 年 5 月 1 日に、金子弘昌著の「Pythonで気軽に化学・化学工学」が出版されました。丸善: Amazon: Amazon(Kindle): こちらの本は、前著の 「化学のための Pythonによるデータ解析・機械学習入門」 ...
[無料公開] 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 の “まえがき”、目次の詳細、第1・2章
2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」が出版されました。講談社: Amazon: Amazon(Kindle): === 出版して約2年経過した 2023 年 4 月 ...

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました