データ解析や機械学習をするときは、常に目的を意識しましょう データセットがあるとき、例えば説明変数 x と目的変数 y の間で機械学習によりモデル y = f(x) を構築します。モデルに x の値を入力することで、y の値を予測でき、予測結果を活用します。このように機械学習によりデータセットを有効... 2021.09.12 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
困ったら基礎やアルゴリズムに立ち戻ることも大事です データ解析や機械学習を活用した研究・開発において、予測精度の高いモデルが作れなかったり、モデルの逆解析で有望そうなサンプルが得られなかったりして、困ったり壁を感じたりしたときの話です。一般的にはその状況を打破するような新たな手法や戦略を探し... 2021.09.05 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
可視化手法・低次元化手法の分類 説明変数 x の数が大きいときなど、データセットを用いてx を潜在変数 z に変換する手法を用いることがあります。z の数が二つのとき、データの可視化 (見える化) になります。手法の例としては、以下のものが挙げられます。 Principa... 2021.09.05 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
コスパは、コストで割るのではなくパレート最適解で考えよう! 工学的な研究をしていますので、最終的には「決める」ことを目指すことになります。例えば、データ解析や機械学習でいえば、ハイパーパラメータをいろいろな候補の中から決めることになりますし、モデルもいろいろな手法で構築されたモデルの中から決めること... 2021.08.29 雑記
目的変数が複数あるときの解析の方針の決め方 説明変数 x と目的変数 y の間でモデル y = f(x) を構築して、新しいサンプルの x をモデルに入力して y を予測したり、y が望ましい値になる x を設計したり (モデルの逆解析) します。このとき、y が複数あることがありま... 2021.08.29 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
実験計画法で実験条件を決めることの意義 まだ実験データがないときに、実験条件を設定して実験することを考えます。実験条件を人が決めるときは、化学的な背景や物理的な背景を考慮したり、装置などの条件に基づいたりして、実験条件を決めることになります。このとき、ある程度実験条件を振ります。... 2021.08.22 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
モデルの適用範囲の手法やハイパーパラメータの選び方 説明変数 x と目的変数 y の間で構築されたモデル y = f(x) を運用するとき、モデルの適用範囲 (Applicability Domain, AD) が必須になります。AD は、モデルが本来の予測性能を発揮できる x のデータ範囲... 2021.08.22 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
未来予測をするモデルを検証するときの注意点 説明変数 x と目的変数 y の間で構築されたモデル y = f(x) の目的として、未来の予測をすることもあります。未来のことはわからないとはいえ、モデルを構築できるということはデータがあるわけですから、データを用いて、構築されたモデルで... 2021.08.15 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
モデルの予測精度と解釈可能性を両立できる手法を開発しました![金子研論文] 金子研の論文が Journal of Computer Chemistry, Japan に掲載されましたので、ご紹介します。タイトルはConstructing Regression Models with High Prediction ... 2021.08.15 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室論文
文章が書ける人と書けない人の違い~読んだ量・書いた量・想像力~ 職業柄、もちろん論文や本やブログなどで自分でも文章を書きますが、学生の文章を添削することもします。学生のなかには、最初からうまく文章を書ける人もいれば、最初はあまりうまく書けず、だんだんとレベルアップする人もいます。その辺りの違いについて考... 2021.08.08 研究室研究発表論文雑記