ケモメトリックス

[無料公開] 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 の “まえがき”、目次の詳細、第1・2章

2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」が出版されました。 講談社: Amazon: Amazon(Kindle): === 出版して約2年経過した 2023 年 4 月...

サンプル・特徴量・データ・データセットなどの用語を整理します!

データ解析・機械学習において、「データ」 の話をするとき、いろいろな用語が飛びかいます。サンプル、特徴量、記述子、変数、説明変数、目的変数、データ、データセットなどです。データ解析や機械学習の議論をするとき、人によって用語の使い方が違うと、...

現在進めている研究内容や最近の興味

金子研で現在進めている研究内容や最近の興味は以下のとおりです。 直接的逆解析法による分子設計・材料成形・プロセス設計 分子設計・材料成形・プロセス設計において、説明変数 x と目的変数 y の間でモデル y=f(x) を構築した後、目標の ...

AD を設定すれば万事OK?

回帰モデルやクラス分類モデルを構築したあとは、それを効果的に使用するため、モデルの適用範囲 (Applicability Domain, AD) を設定する必要があります。 モデルは、説明変数 x の値が入力されれば、それがどんな値でも、目...

LASSO も SVR もスパースモデリング!

特に少数のサンプルでクラス分類モデルや回帰モデルを構築するときに、スパースモデリング (sparse modeling) が注目されています。Sparse を英辞郎で調べると、「まばらな、わずかな、希薄な」 と訳され、データ解析や機械学習に...

Boruta の使い方

特徴量選択手法もしくは変数選択手法の一つに、Boruta があります。 こちらのこちらに書いた通り、 特徴量選択では、「予測精度」が上がるように特徴量を選ぶというより、不要な特徴量を削除するという意識で実施するとよいです。なぜなら、たとえト...

正則化項により過学習(オーバーフィッティング)を防ごう!

回帰モデルを構築するとき、過学習 (オーバーフィッティング) が問題になります。ここではリッジ回帰・LASSO・Elastic Net といった正則化項を用いる手法を例にして、 最小二乗法による線形重回帰分析との関係や、オーバーフィッティン...

「Pythonで気軽に化学・化学工学」出版記念、購入者限定の無料講演会「教えて金子先生!『Pythonで気軽に化学・化学工学』をうまく活用するにはどうしたらいいの?」 を開催します![2021年6月2日(水)19時-]

2021年5月1日に、「Pythonで気軽に化学・化学工学」 が出版されました。初日に Amazon で売り切れになるなど、初速として好調のようです。ご購入いただいた皆さまにお礼申し上げます。ありがとうございます。 プログラミングやPyth...

Gaussian Mixture Regression (GMR) を拡張して直接的モデル逆解析の予測精度を向上させました![金子研論文]

金子研の論文が Chemometrics and Intelligent Laboratory Systems に掲載されましたので、ご紹介します。タイトルは Extended Gaussian Mixture Regression for...

[無料公開] 「Pythonで気軽に化学・化学工学」 の “まえがき”、目次の詳細、第1・2・3章

2021 年 5 月 1 日に、金子弘昌著の「Pythonで気軽に化学・化学工学」が出版されました。 丸善: Amazon: Amazon(Kindle): こちらの本は、前著の 「化学のための Pythonによるデータ解析・機械学習入門」...
タイトルとURLをコピーしました