2019年度金子研オンラインサロンメンバー限定 データ化学工学研究室(金子研究室)成果報告会を終えて 一年に一度の、金子研オンラインサロンメンバー限定のデータ化学工学研究室 (金子研究室) 成果報告会です。2019 年度は 1 月 28日 (火) に行ってまいりました。最終的なプログラムは以下のとおりです。 === 金子研オンラインサロンメ... 2020.02.02 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー学会研究室研究発表
化合物における三次元の化学構造の扱い、構造最適化計算のメリット・デメリット 化合物データの解析をすることを考えます。化合物の化学構造や物性・活性・特性が大事になります。 化合物の物性・活性・特性や化学構造の扱いについてはこちらをご覧ください。 化合物において、その化学構造の特徴を数値化し、数値化したものと物性・活性... 2020.01.19 ケモインフォマティクスケモメトリックスデータ解析研究室
ハイパーパラメータの選択に失敗してしまったときの対処法 データ解析の基本的な流れにおいて、 基本的にクロスバリデーションしたときの推定性能が高くなるように、ハイパーパラメータを選択すると思います。 ハイパーパラメータの候補ごとにクロスバリデーションを行い、回帰分析であれば決定係数 r2 など、ク... 2020.01.12 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
モデルの検証やその後における外れ値・外れサンプルの扱い モデルの検証と、その後についての話です。 データセットをトレーニングデータとテストデータに分け、テストデータを用いて、トレーニングデータで構築されたモデルの検証をします。検証の中で、テストデータを精度良く推定できる手法 (回帰分析手法・クラ... 2020.01.12 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
非線形モデルにおける特徴量の寄与の指標を有効に活用する方法 回帰モデルでもクラス分類モデルでも、モデルを構築したらそのモデルの解釈をしたくなるものです。どの説明変数 (特徴量・記述子・パラメータ) が重要なのか、説明変数が目的変数にどのように寄与しているのか、などなどです。 たとえば説明変数の重要度... 2019.12.15 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
2019年度もデータ化学工学研究室(金子研究室)成果報告会をやります! 金子研の学生たちが今年度に研究した成果を報告します。成果報告会の翌週に応用化学科での四年生の卒業研究発表会がありまして、皆さん発表の完成度を上げていきますので、四年生もしっかりした発表になると思います。 成果報告会への参加費は無料です。ただ... 2019.12.15 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー化学工学研究室
目的変数が複数個あるときのモデルの逆解析、結局どのサンプルを選んだらよいの?? 回帰モデルやクラス分類モデルを構築したあとの、モデルの逆解析についてです。 こちらのチェックリストを確認したあとの話ですね。 モデルの逆解析のとき、目的変数が一つでしたら、その推定値がよさそうなサンプルを選んだり、ベイズ最適化で獲得関数の値... 2019.12.08 ケモインフォマティクスケモメトリックスデータ解析研究室
データセットは生きもの。成長もしますし、それに応じて、モデルも成長します データセットは生きている、と思いながら解析するようにしています。ただ、生物とは何か、、、という話にするつもりはなくてですね、データセットは、サンプルが増えたり減ったり、特徴量 (変数、記述子) が増えたり減ったり、成長しているなあという話で... 2019.12.02 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
回帰分析手法・クラス分類手法の選び方 いつもどんな感じで回帰分析手法・クラス分類手法を選んでいるかお話します。予測結果の r2, RMSE, MAE, 正解率, ... といった指標だけ見て選んでいるわけではありません。 いろいろな回帰分析手法やクラス分類手法がありますね。 現... 2019.12.01 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
ぜんぶオーバーフィッティングのせいだ。 オーバーフィッティングについて考えます。オーバーフィッティングは予測精度の高いモデルを構築するときの問題でして、モデルがトレーニングデータに合いすぎてしまい (目的変数 y の推定誤差が小さくなりすぎてしまい)、新しいデータにおける目的変数... 2019.11.24 ケモインフォマティクスケモメトリックスプロセス制御・プロセス管理・ソフトセンサー研究室