ケモインフォマティクス

半教師あり学習するときはサンプル選択しましょう！[金子研論文][Pythonコードあり]

半教師あり学習 (半教師付き学習) に関する、金子研学生との共著論文が Chemometrics and Intelligent Laboratory Systems に掲載されました。半教師あり学習のメリットはこちらに書いたとおりでして、...

2019.07.07

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室論文

いろいろなデータセットを解析する上で、データ解析の基本的な流れを整理しておきます。ここでは、回帰分析やクラス分類をするときにように、教師ありのデータセット、つまり目的変数 Y があるようなデータセットを解析することを想定しています。流れにお...

2019.06.30

ケモインフォマティクスケモメトリックスデータ解析研究室

回帰分析のときに、教師ありデータ (目的変数 y の値がそろったデータ) と教師なしデータ (y の値がないデータ) とを合わせてから主成分分析 (Principal Component Analysis, PCA) で成分 (潜在変数) ...

2019.06.30

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

回帰分析やクラス分類をする前の、データセットの前処理の話です。2 つの説明変数 (記述子・特徴量) の間で、相関係数の絶対値が大きいとき、それらの変数は似ているということです。余計な変数は、回帰モデル・クラス分類モデルに悪影響を及ぼすため、...

2019.06.25

ケモインフォマティクスケモメトリックスデータ解析プログラミングプロセス制御・プロセス管理・ソフトセンサー研究室

Boruta という、ランダムフォレスト (Random Forest, RF) の変数重要度に基づいた変数選択手法について、パワーポイントの資料とその pdf ファイルを作成しました。いろいろなデータセットを解析しましたが、モデルの推定性...

2019.06.23

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

以前に、Structure Generator based on R-Group (SGRG) という化学構造を生成する Python プログラムを公開しました。メインの骨格を一つに設定して、その自由結合手に結合する側鎖を、フラグメントの候...

2019.06.16

ケモインフォマティクスケモメトリックスデータ解析研究室

ここ 2,3 ヶ月、本を書いていまして、先週に脱稿しました。内容のキーワードとしては、 Python 初学者データ解析機械学習分子設計材料設計ソフトセンサー異常検出・診断といった感じです。サンプルプログラム付きで勉強しやすく、実...

2019.06.09

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

金子研オンラインサロンをはじめてから 1 年が経ちました。登録者は 162 名です (2019年6月9日現在)。学生、大学教員、企業の方など、いろいろな立場の方が参加されていまして、化学だけでなく物理・工学・経済などいろいろな分野を背景にも...

2019.06.08

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー化学工学研究室

こちらの↓部分的最小二乗回帰 (Partial Least Squares Regression, PLS) の回帰係数についてです。上の記事を読んでいたりして PLS のことを知っていること前提でお話します。PLS でも、y = Xb の...

2019.06.02

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室

昨年度も 3 月に金子研の学生たちが卒業していきました。少し遅くなってしまいましたが、2018 年度の学生の研究成果をまとめておきます。江尾は医薬品設計に関する研究です。活性の測定された化合物を用いて、活性 y と記述子 x との間で機械学...

2019.05.29

ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー化学工学研究室