Datachemical LABでスペクトルの変換ができるようになりました

いつも Datachemical LAB をご利用いただきありがとうございます。

これまでご紹介させていただいた通り、Datachemical LAB を使用することで、データの前処理・データの可視化・特徴量計算・回帰分析・モデルの逆解析・モデルの適用範囲・化学構造生成・(適応的)実験計画法・能動学習・ベイズ最適化・ソフトセンサー・異常検出・直接的逆解析・クラス分類などの、データ解析・機械学習が、プログラミングなしで可能になります。

化学・化学工学分野におけるデータ解析・機械学習クラウドサービス「Datachemical LAB」
化学・化学工学分野におけるデータ解析・機械学習が、プログラミングなしでできるクラウドサービス「Datachemical LAB」を開発し、提供を開始しましたので、ご案内します。プレスリリースは以下をご覧ください。Datachemical L...

 

そして、Datachemical LAB にスペクトルの変換の機能が加わりました!プレスリリースはこちらです。

 

Datachemical LAB のメニューの材料設計に、「スペクトル」があります。

 

 

分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。

x もしくは y として、分光分析・振動分光法等によるスペクトルを用いることがあります。例えば、fed-batch cell culture process を対象として、培養液における Fourier transform near infrared (FT-NIR) multiplex process analyzer spectroscopy のスペクトルを x、グルコース濃度と乳酸濃度を y とし、x と y の間で回帰モデル y=f(x) を構築することで、FT-NIRスペクトルからグルコース濃度と乳酸濃度を推定できます。

波長選択と転移学習により培養液におけるグルコース濃度と乳酸濃度の予測精度が向上しました![日立製作所&金子研の共同研究論文]
日立製作所と金子研における共同研究の成果の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルはTransfer learning and wavelength selection m...

 

また、バイオマテリアルを対象として、合成条件を x、FI-IR スペクトルをはじめとする材料特性を y としてモデル y = f(x) を構築したり、FI-IR スペクトルをはじめとする材料特性と動物実験条件を x、動物実験の結果である骨形成率を y として別のモデル y = g(x) を構築したりもします。

機械学習によりバイオマテリアルの材料特性と骨形成率を予測するモデルを構築し、直接的逆解析により新規材料の設計をしました! [相澤研&金子研の共同研究論文]
相澤研と金子研における共同研究の成果の論文が Industrial & Engineering Chemistry Research に掲載されましたので、ご紹介します。タイトルはMachine Learning Model for Pre...

 

スペクトルにはノイズが含まれていたり、サンプルごとにスペクトルのベースラインが異なったりするため、スペクトルを適切に前処理することで、モデルの予測精度が大きく向上することがあります。今回、Datachemical LAB に、Savitzky-Golay (SG) 法によるスペクトルの変換機能を追加しました。SG 法により、ノイズの低減とベースライン補正を同時に実施できます。SG 法の詳細についてはこちらをご覧ください。

スペクトル・時系列データの前処理の方法~平滑化 (スムージング) と微分~
スペクトル解析のときや、時系列データを扱うときの話です。いくつかの点でスペクトルデータと時系列データは似ています。たとえば、隣同士の値が似ているっていう点ですね。他にも、データにノイズが含まれるという点も共通した特徴です。このようにスペクト...

 

なお、スペクトルごとの標準化 (Standard. Normal Variate, SNV) についても選択できます。

Datachemical LAB でスペクトルを SG 法により変換した後は、他の解析にスムースに移ることができます。例えば、スペクトルを x として使うとき、多くの場合において特徴量の数が多くなるため、SG 法による変換の後に、Boruta で特徴量を選択することもあります。

[解析結果付き] Boruta、ランダムフォレストの変数重要度に基づく変数選択手法
Boruta という、ランダムフォレスト (Random Forest, RF) の変数重要度に基づいた変数選択手法について、パワーポイントの資料とその pdf ファイルを作成しました。いろいろなデータセットを解析しましたが、モデルの推定性...

 

Datachemical LAB によりスムースに SG法 → Boruta を実現できます。これにより、適切に変換された少数の特徴量のみでモデル構築を検討できます。サンプルが少ないときでも良好な結果が得られやすくなります。

スペクトル解析を含めて、ぜひDatachemical LABを活用していただければと思います。

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました