[Pythonコード付き] テストデータのMAEをトレーニングデータから推定する方法を開発したので紹介します [金子研論文]

回帰分析において、新しいサンプルを推定するときの誤差の絶対値の平均値を推定するための指標を開発しました。イメージとしては、テストデータとしてサンプルがたくさんあるときの、モデルの適用範囲 (Applicability Domain, AD)...

クロスバリデーション(交差検定)のとき、変数の標準化(オートスケーリング)はどうするか?

金子研オンラインサロンにおいて、メンバーの方からクロスバリデーションのとき変数の標準化 (オートスケーリング) に関して質問がありました。とても大事な視点であり、一言では回答できない内容でしたので、ブログで取り上げさせていただきました。質問...

2019年度ゼミ合宿 写真

今年のゼミ合宿は、越後湯沢で行いました。金子研ゼミ合宿@越後湯沢 に行ってまいりました。ラフティングをしたりゼミをしたり。ゼミの課題はモデルの逆解析。学生ごとにいろいろなデータセットを解析しており、それに基づいて議論に花を咲かせました。内容...

プログラミング未経験者のためのデータ解析・機械学習、連載スタート!

化学工学会の会誌で、Python でデータ解析・機械学習をおこなうための連載が始まりました。〔連載〕プログラミング未経験者のためのデータ解析・機械学習が化学工学会の会誌でスタートしました!1. 本連載のねらい・Jupyter Noteboo...

モデルの逆解析をするときのチェックリスト

回帰モデルやクラス分類モデルを構築したら、モデルの逆解析を行うことで、目的変数の目標値を達成すると考えられる説明変数の値を推定できます。ただ、モデルの逆解析をするときは、いくつか注意点がありますので、チェックリストとしてまとめました。モデル...

[解析結果とPythonコードあり] 転移学習 (Transfer Learning) を用いたデータ解析

転移学習 (Transfer Learning) について、パワーポイントの資料とその pdf ファイルを作成しました。どんなシチュエーションで転移学習が使えるのか、そして転移学習により本当にモデルの精度は向上するのか、数値シミュレーション...

すでに100万サンプル超え!?金子研ではこれまでどのようなデータセットを扱ってきたのか

これまで金子研では、学生たちやわたしが、いろいろな種類のデータセットを扱ってまいりました。参考までに、これまでのデータセットを、教師ありのサンプル数 (目的変数の値のあるサンプル数) と一緒にまとめました。共同研究に関するものなど、ぼやかし...

本はビュッフェ!

本、特に専門書を読むときは、ビュッフェ (食べ放題バイキング) で食べるときのように、という話です。本を読みはじめるとき、必ず目的があります。本を読み終えることが目的ではないはずです。その本からどんな知識・技術を得たいのか、本を読んだ後にそ...

[Pythonコードあり] GTMR(Generative Topographic Mapping Regression)でデータの可視化・回帰分析・モデルの適用範囲・モデルの逆解析・化学構造生成をいっぺんにやってしまいます! (物性・活性が2つ以上でもOK)

またまた Structure Generator based on R-Group (SGRG) という化学構造を生成する Python プログラムへの、新たな機能追加です。前回はベイズ最適化 (Bayesian Optimization,...

[Pythonコードあり] ベイズ最適化で所望の物性や活性となる確率の高い化学構造を生成する (物性・活性が2つ以上でもOK)

Structure Generator based on R-Group (SGRG) という化学構造を生成する Python プログラムへの、新たな機能追加です。今回の機能追加でバージョンを 1.0 → 2.0 としました。SGRG に関...
タイトルとURLをコピーしました