研究室

任意のクラスタリング手法においてクラスター数を自動的に決める方法

回帰分析やクラス分類などの教師あり学習における各手法のハイパーパラメータ (PLS における成分数や SVR における C, ε など) と比べて、データの可視化やクラスタリングなどの教師なし学習における各手法のハイパーパラメータ (t-S...

ベイズ最適化と遺伝的アルゴリズム(などの組合せ最適化アルゴリズム)の本質的な違いとは?

分子設計や材料設計やプロセス設計において、分子や合成条件や実験条件やプロセス条件などの説明変数 x と物性や活性などの目的変数 y との間でガウス過程回帰 (Gaussian Process Regression, GPR) モデルを構築し...

モデルの予測精度を上げればゴール?~真の目的をふまえて解析しよう!~

分子設計や材料設計やプロセス設計において、分子記述子や合成条件や実験条件やプロセス条件などの説明変数 x と物性や活性などの目的変数 y との間でモデル y = f(x) を構築し、そのモデルを用いて新たな分子や材料の化学構造や合成方法やプ...

すべてを機械学習でやらなくてもよいです!

分子設計・材料設計・プロセス設計において、実験条件・合成条件・プロセス条件などの説明変数 x と物性・活性などの目的変数 y との間でモデル y = f(x) を構築し、モデルに基づいて y が所望の値となる x の値を設計することが行われ...

0を含む変数を対数変換するときはどうすればよいのか?

説明変数 x と目的変数 y との間で回帰モデル y = f(x) を構築するとき、x と y の間の関係を的確に表現したり、モデルの予測精度を向上させたりするため、y を対数変換して用いることがあります。化学的・物理的な背景や x と y...

モデルの適用範囲(Applicability Domain, AD)の検討の仕方

データセットを用いて、目的変数 y と説明変数 x の間で回帰モデルやクラス分類モデルを構築した後に、モデルを適切に運用するため、モデルの適用範囲 (Applicability Domain, AD) を設定します。 AD を設定する方法は...

y-randomization(y-scrambling)の結果が悪いとき、どうすればいいのか?

回帰モデルやクラス分類を構築したいとき、扱うデータセットごとに適した手法は異なるため、今のデータセットに適した手法を選択するため、手法ごとの予測性能を評価します。トレーニングデータとテストデータに分けて、トレーニングデータで構築されたモデル...

学生の成長の律速を考えてアドバイスやサポートをするようにしています

データ化学工学研究室 (金子研) では、学生が研究成果をあげること、ではなく、研究成果をあげ続ける力を学生が身につけること、すなわち学生の成長を第一に考えています。 研究成果の有無についてはとりあえず考えず、それより学生が力をつけることを第...

手法や手段を目的化しないように気をつけましょう!~データ解析・機械学習が目的ではありません~

データ解析・機械学習によって分子設計・材料設計・プロセス設計などを効率化する試みがあります。例えば、目的変数 (物性・活性・製品品質など) y と説明変数 (実験条件・合成条件・プロセス条件など) x との間で、既存のデータセットに基づいて...

学生に言い方を変えて繰り返し伝えるようにしています

私は普段から、相手の話を聞くときや、伝えたいことを相手に伝えるときに、コミュニケーションの相性のようなものを意識しています。相手に伝えたいことが 100 あるとして、それを伝えたときに、相手がコミュニケーションの相性がよい A さんのときに...
タイトルとURLをコピーしました