ケモインフォマティクス

モデルの検証やその後における外れ値・外れサンプルの扱い

モデルの検証と、その後についての話です。 データセットをトレーニングデータとテストデータに分け、テストデータを用いて、トレーニングデータで構築されたモデルの検証をします。検証の中で、テストデータを精度良く推定できる手法 (回帰分析手法・クラ...

非線形モデルにおける特徴量の寄与の指標を有効に活用する方法

回帰モデルでもクラス分類モデルでも、モデルを構築したらそのモデルの解釈をしたくなるものです。どの説明変数 (特徴量・記述子・パラメータ) が重要なのか、説明変数が目的変数にどのように寄与しているのか、などなどです。 たとえば説明変数の重要度...

2019年度もデータ化学工学研究室(金子研究室)成果報告会をやります!

金子研の学生たちが今年度に研究した成果を報告します。成果報告会の翌週に応用化学科での四年生の卒業研究発表会がありまして、皆さん発表の完成度を上げていきますので、四年生もしっかりした発表になると思います。 成果報告会への参加費は無料です。ただ...

目的変数が複数個あるときのモデルの逆解析、結局どのサンプルを選んだらよいの??

回帰モデルやクラス分類モデルを構築したあとの、モデルの逆解析についてです。 こちらのチェックリストを確認したあとの話ですね。 モデルの逆解析のとき、目的変数が一つでしたら、その推定値がよさそうなサンプルを選んだり、ベイズ最適化で獲得関数の値...

データセットは生きもの。成長もしますし、それに応じて、モデルも成長します

データセットは生きている、と思いながら解析するようにしています。ただ、生物とは何か、、、という話にするつもりはなくてですね、データセットは、サンプルが増えたり減ったり、特徴量 (変数、記述子) が増えたり減ったり、成長しているなあという話で...

回帰分析手法・クラス分類手法の選び方

いつもどんな感じで回帰分析手法・クラス分類手法を選んでいるかお話します。予測結果の r2, RMSE, MAE, 正解率, ... といった指標だけ見て選んでいるわけではありません。 いろいろな回帰分析手法やクラス分類手法がありますね。 現...

ぜんぶオーバーフィッティングのせいだ。

オーバーフィッティングについて考えます。オーバーフィッティングは予測精度の高いモデルを構築するときの問題でして、モデルがトレーニングデータに合いすぎてしまい (目的変数 y の推定誤差が小さくなりすぎてしまい)、新しいデータにおける目的変数...

2019年度 応用化学科ポスター発表会、いつもどおり金子研オンラインサロンでポスターをシェアします(共同研究関係を除く)

2019年11月23日(土) に応用化学科ポスター発表会がありました。 金子研、練習もばっちりです。お待ちしております! わたしも色々な研究室を回ります。#応用化学科研究ポスター発表会 pic.twitter.com/Utj0nyeAqR ...

金子研の研究、特に共同研究で難しいのは、データの収集の仕方・データの前処理・特徴量設計・モデルの逆解析・化学構造生成の5つです!

データ化学工学研究室 (金子研) では、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスに関する、いろいろな研究をしています。企業や大学・研究所との共同研究もしています。金子研の研究、特に共同研究をするとき...

「化学のためのPythonによるデータ解析・機械学習入門」 正誤表

Amazon をはじめとして、在庫の補充が遅れており申し訳ございません。発売 3 日後に重版がかかるなど、理工学書としてこれまでにない売れ行きだそうで、出版社もバタバタしているとのことです。もう少しお待ちいただけますと幸いです。 そんな中、...
タイトルとURLをコピーしました