いつも Datachemical LAB をご利用いただきありがとうございます。
Datachemical LAB の利用を検討するとき、他のデータ解析・機械学習のソフトウェアと何が違うのか、気になる方もいらっしゃると思います。Datachemical LAB は、データ化学工学研究室 (金子研究室) における研究や大学・研究所・企業と実施している共同研究において、Python で実施している内容や、データ解析・機械学習、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス、そして分子設計・材料設計・プロセス設計・プロセス管理で培われた技術・知見を、プログラミングは一切なしにブラウザ上で実施できるようにしたものです。このウェブサイトにおけるブログのすべての内容や、論文等で発表した研究成果・技術・知見を存分に搭載しています。
Datachemical LAB は他のソフトウェアと何が違うのか、に対して、上のようなソフトウェアです、と一言で答えることもできますが、もう少し丁寧に、他のソフトウェアと何が違うのか以下にまとめます。
- 1. 多種多様な回帰分析手法・クラス分類手法が搭載されている
- 2. 回帰分析手法やクラス分類手法の最適化・パラメータチューニング・サンプル生成・ベイズ最適化・欠損値補完・化学構造生成・特徴量変換・特徴量選択・・・などにおいて金子研で培われた技術・知見が用いられている
- 3. データ解析・機械学習だけでなく新たな設計ができる
- 4. ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスにより分子設計・材料設計・プロセス設計・プロセス管理のすべて、そしてそれらの組み合わせに対応している
- 5. 直接的逆解析ができる
- 6. 頻繁にアップデートされている
- 7. データ解析・機械学習用のパソコンやサーバーを準備する必要がない
- 8. 操作性が高く使いやすい
- 9. ユーザーサポートが充実している
1. 多種多様な回帰分析手法・クラス分類手法が搭載されている
データ解析・機械学習をよく実施する方はご存知の通り、すべてデータセット・すべての目的変数 y に対してベストな性能を発揮できる機械学習の手法はありません。回帰分析をするときもクラス分類をするときも、今あるデータセット、そして対象の y に合った手法を最適化して用いる必要があります。
そのため、そもそも回帰分析手法の選択肢やクラス分類手法の選択肢が多い必要があります。Datachemical LAB には本当に多種多様な回帰分析手法・クラス分類手法が搭載されています。しかも、実際に金子研でも成果を発揮してきた手法です。
2. 回帰分析手法やクラス分類手法の最適化・パラメータチューニング・サンプル生成・ベイズ最適化・欠損値補完・化学構造生成・特徴量変換・特徴量選択・・・などにおいて金子研で培われた技術・知見が用いられている
上のような多種多様な回帰分析手法・クラス分類手法を利用できたとしても、データセットや y にあう適切な手法を最適化できなければ意味がありません。過学習 (オーバーフィッティング) したモデルを利用することになってしまったり、予測精度が高いと誤解したまま精度の低いモデルを利用したりしてしまうと、せっかくの苦労 (データ解析・機械学習の苦労だけでなく実験の苦労やデータ収集・整理の苦労なども) が水の泡です。
今あるデータセットを有効に活用して最大限の成果を出すためには、嘘をつかないデータ解析・機械学習をすることが一番の近道です。Datachemical LAB では、これまで金子研で嘘をつかないデータ解析・機械学習の方法論を通して、データセットや y ごとに最適な手法を選択できます。もちろん回帰分析手法やクラス分類手法の最適化だけでなく、モデルのパラメータチューニング・サンプル生成・ベイズ最適化・欠損値補完・化学構造生成・特徴量変換・特徴量選択・・・などにおいても同様に金子研の技術・知見が Datachemical LAB に適用されていますので、Datachemical LAB を用いることで、今あるデータセットに対して最大限の成果を発揮できるような仕組みになっています。
3. データ解析・機械学習だけでなく新たな設計ができる
多くのソフトウェアでは、データ解析をして結果を表示するだけだったり、機械学習でモデルを構築して予測するだけだったりします。もちろん、このデータ解析・モデル構築だけを取っても、上で述べたようにDatachemical LAB の優位性はありますが、さらにそれだけでなく、次の実験条件・合成条件・評価条件・プロセス条件・製造条件といった設計が可能です。
データ解析・機械学習は、あくまでそれ自体が目的ではなく、実験やシミュレーションの現場をサポートすることが目的です。言い換えると、予測精度の高いモデルを構築することが目的ではなく、そのモデルを使って効果的な設計をすることが目的です。せっかく予測精度の高いモデルを構築できたとしても、有効に活用できなければ全く意味がありませんDatachemical LAB では予測精度の高いモデルを構築できるだけでなく、構築されたモデルを使って最大限の効果を発揮できる設計ができます。
4. ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスにより分子設計・材料設計・プロセス設計・プロセス管理のすべて、そしてそれらの組み合わせに対応している
設計と一言でいっても、分子設計・材料設計・プロセス設計のように化学や化学工学の分野でも色々な設計があります。Datachemical LAB ではこれら全ての設計、そしてそれらの組み合わせに対応しています。分子の化学構造を効果的に扱ったり、化学構造を自動的に生成したり、実験条件として色々な制約を考慮して新たな実験条件を生成したり、プロセスの動特性を考慮して時系列データを有効利用したモデル構築や設計をしたりできます。金子研では、普段から多くの大学・研究所・企業と共同研究をしており、まさに分子設計・材料設計・プロセス設計の実際の現場で日々研究しています。このような実際に経験した分子設計・材料設計・プロセス設計が誰でもできるように、Datachemical LABの機能が充実しています。
もちろんプロセス管理に関しても現場での共同研究をしていますので、適応型ソフトセンサーや異常の予測など、まさに現場で問題となっていることを解決できる手法が搭載されています。さらに、適応型ソフトセンサーや異常の予測は、ブラウザ上だけでなく、実際のローカルな環境でも実施可能です。装置やプラントに Datachemical LAB を組み込めます。
5. 直接的逆解析ができる
分子設計・材料設計・プロセス設計に必要なことは y の目標値からそれを実現するための x を導くことです。これをモデルの逆解析と呼びます。ただ、一般的なモデルの逆解析で行われていることは、x の仮想サンプルをコンピュータで大量に生成し、それらをモデルに入力して y の値を予測し、予測値が良好な仮想サンプルを選択する、すなわち順解析を網羅的に繰り返す擬似的な逆解析にすぎません。これでは人が事前に想定した x の探索範囲における y を予測することにすぎず、当初想定しない条件でこそ発現する新機能の探索には全く対応できません。
金子研究室では、y の値から x の値を直接的に予測する、すなわち数理モデルを直接的に逆解析する手法「直接的逆解析法」を開発しています。
ベイズ最適化を凌ぐ実験条件探索の効率化や
バッチプロセスにおける初期運転条件およびバッチ中の時系列データ(バッチプロファイル)の設計に成功しました。
Datachemical LAB を用いることで、直接的逆解析法により y の目標値から直接 x の値を自由自在に予測できます。さらに y が複数存在する場合でも全ての y の目標値を満たす x の値を提案できます。
Datachemical LAB では、y それぞれの目標値を設定します。複数の目標値を設定することも可能です。
直接的逆解析ができるのは Datachemical LAB だけです。
6. 頻繁にアップデートされている
直接的逆解析に限らず、金子研では様々な手法が開発されています。新たな手法を搭載する形で Datachemical LAB をアップデートするのはもちろんのこと、ユーザーの反応や感想に基づいて操作性や細かい処理のところでも頻繁にアップデートしています。
金子研では Python でプログラミングをしており、基本的に言葉で表現できることは Python プログラミングで実現でき、それをプログラミングなしで実施できる Datachemical LAB に搭載している、といった流れになります。臨機応変な対応で丁寧にアップデートしています。
7. データ解析・機械学習用のパソコンやサーバーを準備する必要がない
データ解析・機械学習をするにはどれくらいのスペックのパソコン・マシンが必要ですか?といった質問はよくありますが、Datachemical LAB を使うときは、パソコンのスペックを気にする必要は全くありません。Datachemical LAB はブラウザ上で動くため、パソコンのスペックに関係なく、データ解析・機械学習をすることができます。例えば、普段資料作りに使っているノートパソコンで十分です
8. 操作性が高く使いやすい
実際に Datachemical LAB を使用する現場の方の視点から使いやすいことはもちろんのこと、ユーザーインターフェース (User Interface, UI) の専門家とタッグを組んで Datachemical LAB を開発していることから、普段データ解析・機械学習をしていない方、もしくはプログラミングを全くしたことがない人でも、直感的に操作できるようになっています。本当にサクサク操作・実行できるため、私の講演中も、データ解析・機械学習をしてみたり、いろいろな設計を実際に行ったりすることができ、とても助かっています。
9. ユーザーサポートが充実している
Datachemical LAB の操作における不明点はもちろんのこと、データセットの不明点やお手持ちのデータセットの解析における不明点や Datachemical LAB の実行結果の不明点など、いただいた質問に対して的確にお答えするユーザーサポートが充実しています。Datachemical LAB を使いこなせないのではないか、、、といった心配は全くなく、ご安心して利用できます。
以上です。Datachemical LAB をご検討の際に参考になりますと幸いです。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。