特徴量の標準化(オートスケーリング)をするときのちょっとした工夫

説明変数 x のデータを準備して、低次元化やクラスタリングによりデータセットの可視化や解釈をしたり、x と目的変数 y のデータを揃えて回帰分析やクラス分類をしたりするときに、データセットの前処理の一つとして、基本的に特徴量の標準化 (オー...

「やりたいこと」と「できること」をつなぐデータ解析・機械学習(AI・人工知能)

分子設計・材料設計・プロセス設計・プロセス管理において、これまでに蓄積されたデータを収集・整理して、分子記述子・合成条件や製造条件・プロセス条件・プロセス変数 x と分子や材料の物性・活性・特性や製品品質 y との間で数理モデル y = f...

データ解析・機械学習の学会発表・報告会をしたり論文・報告書を書いたりするときに注意したいこと

ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスに関して研究・開発して、ある程度研究成果が出てきますと、学会で研究発表したり、研究室内や社内で報告会をしたり、論文を書いたり報告書としてまとめたりすると思いま...

データセットに合わせて主成分分析PCAを有効に活用する

回帰モデルやクラス分類モデルを構築するとき、データセットの前処理や特徴量の低次元化を目的として、主成分分析 (Principal Component Analysis, PCA) を行うことがあります。可視化・低次元化の手法としては最も基本...

特徴量選択・変数選択をするときのハイパーパラメータの決め方や考え方

分子設計・材料設計・プロセス設計・プロセス制御において、分子記述子・合成条件や製造条件・プロセス条件・プロセス変数などの特徴量 x と材料の物性・活性・特性や製品の品質など目的変数 y との間で数理モデルを構築します。y の関係のない x ...

モデルの適用範囲の広さを評価する方法

分子設計・材料設計・プロセス設計・プロセス制御において、分子記述士・合成条件や製造条件・プロセス条件・プロセス変数などの特徴量 x と材料の物性・活性・特性や製品品質などの目的変数 y との間で、数理モデル y = f(x) を構築します。...

公開動画

これまでデータ化学工学研究室 (金子研究室) 関係で公開されている動画をまとめます。公開動画が追加され次第、新しい順に追加していきます。・2024 年 1 月 31 日 『実例で学ぶ化学工学』 解説動画【動画で解説!】8章 8.1 伝導伝熱...

実験計画法・適応的実験計画法における特徴量選択とモデルの適用範囲

分子設計・材料設計・プロセス設計において、最初の実験・シミュレーションの合成条件・製造条件・プロセス条件などを実験計画法により決め、実験やシミュレーションをしたあとに得られるデータを用いて、特徴量 x と材料の物性・活性・特性 y との間で...

ホモポリマーとコポリマーを同時に設計する高分子設計手法を開発しました![金子研論文]

金子研の論文が Polymer Engineering & Science に掲載されましたので、ご紹介します。タイトルはMolecular design of monomers by considering the dielectric ...

GridSearchCVでハイパーパラメータの最適化に失敗した時の原因と対処法

回帰モデルやクラス分類モデルにおけるハイパーパラメータを最適化するため、scikit-learn の GridSearchCV を使用する人がいらっしゃると思います。特に複数の種類のハイパーパラメータがあるとき、GridSearchCV を...
タイトルとURLをコピーしました