ケモインフォマティクス

回帰係数=寄与度とすることは危険、どうしても寄与度を求めたいときはPCRやPLSの1成分モデルで、ただ基本的には寄与度ではなく重要度で議論

タイトルで言いたいことはほとんど言っていますが、丁寧に説明します。たとえば最小二乗法による線形重回帰分析や部分的最小二乗回帰 (Partial Least Squares Regression, PLS) や Least Absolute ...

2020.11.22

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー

データ解析・機械学習を行うためには、データセットが必須です。エクセルファイルや実験ノートなどからデータを集めて、整理してまとめると思います。そのようにしてデータセットを作成するとき、注意することがあります。６つそれぞれ説明します。1. xl...

2020.11.15

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

説明変数 X と目的変数 Y の間でモデル Y = f(X) を構築するとき、やはり今あるデータで構築できる最適なモデルを構築したいと思います。そのためモデルを設計します。新たな X を提案・作成したり、X の組み合わせを選んだり、回帰分析...

2020.10.25

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

データ解析や機械学習の相談を受けるとき、背景やデータの内容を聞くだけで、上手くいきそうとか、上手くいかなさそうとか、感覚的にわかることがあります。実際にデータを見るとその確度が高まりますが、データを見なくても、ある程度わかったりします。たと...

2020.10.18

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

説明変数 X と目的変数 Y の間で回帰モデル Y = f(X) を構築するとき、X と Y の間の関係は一貫している必要があります。下の図をご覧ください。上の (a) の図では、X と Y の間の関係は一貫していません。X の値が p の...

2020.10.04

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

金子研の論文が Materials & Design に掲載されましたので、ご紹介します。タイトルはDirect inverse analysis based on Gaussian mixture regression for multi...

2020.09.27

ケモインフォマティクスケモメトリックスデータ解析研究室論文

金子研の論文が Molecular Informatics に掲載されましたので、ご紹介します。タイトルはTwo‐ and three‐dimensional quantitative structure‐activity relation...

2020.09.20

ケモインフォマティクスデータ解析研究室論文

目的変数 Y と説明変数 X との間で、回帰分析やクラス分類を行い、モデル Y = f(X) を構築します。もちろん予測精度の高いモデルが望ましいですので、モデルの予測精度を上げるために、いろいろと工夫をします。その工夫の方針は、以下の 5...

2020.09.13

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

共同研究やコンサルティングなどで、いろいろな方々とお話していると、データ解析・機械学習に関連した誤解があることに気づきます。確かに、一見妥当そうな内容ですので、誤解するのは仕方ないと思いますし、実際、中にはわたしも昔に同じことを考えており、...

2020.09.06

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

データセットを用いて、目的変数 Y と説明変数 X との間で回帰モデル Y = f(X) を構築し、そのモデルに X の値を入力することで Y の値を予測することがあります。その予測結果を、下の図のような Y の実測値 vs. 予測値のプロ...

2020.09.06

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室