ケモインフォマティクス

SELFIESに基づいてシンプルに新規な化学構造を生成するPythonコードをDCEKitに公開します!

(アイキャッチ画像は、Midjourney にて chemical structures, molecules, organic chemistry, benzene, carbon, hydrogen で描画)データ解析・機械学習に基づい...

Datachemical LABで解ける実践的な課題

Datachemical LAB をご利用いただき、皆様どうもありがとうございます。分子設計・材料設計・プロセス設計におけるいろいろな問題・課題に対して、ご活用いただいているようで開発者としてとても嬉しい限りです。ご質問やご要望もいただいて...

サンプルをグループごとにトレーニングデータとテストデータに分割する機能をDCEKitに搭載しました!

回帰モデルやクラス分類モデルの予測性能を評価するとき、トレーニングデータとテストデータにサンプルを分割して、トレーニングデータでモデルを構築し、テストデータで構築されたモデルを評価します。一般的には、scikit-learn の train...

Datachemical LAB の出現によるデータ解析・機械学習の変化

分子設計・材料設計・プロセス設計・プロセス管理において、データ解析・機械学習をすることが一般的になってきました。ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスという言葉も色々な場面で使われています。企業の...

Datachemical LABによって研究者やエンジニアが実験や製造に集中できるようになった

ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスが一般的に行われるようになってきました。これまで蓄積されたデータを用いたり、これから得るためのデータをうまく活用したりして、データ解析・機械学習によって構築し...

データは嘘をつかないので、データを集めたりデータから得られる結果を解釈したりするときにデータに嘘をつかないようにする

分子や材料やプロセスのデータを扱い、データ解析・機械学習をします。その結果、数理モデルが得られたり、数理モデルに基づいて新たな材料や分子や材料やプロセスを設計できたりします。データ解析や機械学習で扱われるデータは、多くの場合、人が集めます。...

特徴量の標準化(オートスケーリング)をするときのちょっとした工夫

説明変数 x のデータを準備して、低次元化やクラスタリングによりデータセットの可視化や解釈をしたり、x と目的変数 y のデータを揃えて回帰分析やクラス分類をしたりするときに、データセットの前処理の一つとして、基本的に特徴量の標準化 (オー...

「やりたいこと」と「できること」をつなぐデータ解析・機械学習(AI・人工知能)

分子設計・材料設計・プロセス設計・プロセス管理において、これまでに蓄積されたデータを収集・整理して、分子記述子・合成条件や製造条件・プロセス条件・プロセス変数 x と分子や材料の物性・活性・特性や製品品質 y との間で数理モデル y = f...

データセットに合わせて主成分分析PCAを有効に活用する

回帰モデルやクラス分類モデルを構築するとき、データセットの前処理や特徴量の低次元化を目的として、主成分分析 (Principal Component Analysis, PCA) を行うことがあります。可視化・低次元化の手法としては最も基本...

特徴量選択・変数選択をするときのハイパーパラメータの決め方や考え方

分子設計・材料設計・プロセス設計・プロセス制御において、分子記述子・合成条件や製造条件・プロセス条件・プロセス変数などの特徴量 x と材料の物性・活性・特性や製品の品質など目的変数 y との間で数理モデルを構築します。y の関係のない x ...
タイトルとURLをコピーしました