ケモメトリックス

2018年度金子研オンラインサロンメンバー限定 データ化学工学研究室(金子研究室)成果報告会を終えて

1月29日 (火) に、金子研オンラインサロンメンバー限定のデータ化学工学研究室 (金子研究室) 成果報告会を行ってまいりました。最終的なプログラムは以下のとおりです。 === 金子研オンラインサロンメンバー限定 2018年度データ化学工学...

科研費や助成金やDC1などで採択されたときの申請書を公開します!

これまで科研費だけでなく、いろいろな財団からの助成金をいただき、研究を進めたり研究成果を発表したりしてまいりました。そのお陰様をもちまして、順風満帆に研究を進められております。感謝申し上げます。 研究を進めるためにお金が必要なことは、研究者...

モデルの推定性能を評価しても、その結果で最適化したら評価にならないので注意ですよ!

データ解析とか機械学習とかの話です。こちらの話と関連があります。 たとえば回帰分析で、最小二乗法による線形重回帰分析 (Ordinary Least Squares, OLS) をしたとします。 クロスバリデーションで外部データに対する O...

【失敗例】yの値を推定したいサンプルがモデルの適用範囲内に入るように変数選択と次元削減をすればいいのでは!?

これから書くことか過去の失敗例です。ご注意ください。 回帰モデルでもクラス分類モデルでも、あるデータセットに基づいてモデルが構築されたとします。そのモデルを用いて新しいサンプルの目的変数 y の値を推定するとき、新しいサンプルがモデル構築用...

バリデーション結果は、少数の比較には使ってよいが最適化に使ってはいけない!~外部バリデーションや(ダブル)クロスバリデーションでは何を評価しているのか?評価するときのジレンマとは?~

回帰モデルやクラス分類モデルを評価するときの話です。評価のときに、クロスバリデーションやダブルクロスバリデーションが使われることもありますが、 それぞれ何のために、何を評価しているのか?についてお話します。 そもそも、どうしてモデルを評価し...

第46回構造活性相関シンポジウムへの参加と学生の口頭発表

大阪大学の銀杏会館にて2018年12月5日(水)・6日(木)で開催された第46回構造活性相関シンポジウムに参加し、金子研の B4 江尾知也@修士に進学する期待の学生 が口頭発表してきました。発表資料は金子研オンラインサロンにて共有しています...

サンプルが少ないときはどうするか?・・・うーん、仕方がないのでデータ分布を仮定してたくさんサンプリングしましょう! (多変量の場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。 今回は変数が複数 (多変量) のときです。ちなみに変数がひとつ (単変量) のときはこちらです。 多変量でも、データ...

サンプルが少ないときはどうするか?・・・うーん、仕方がないので幅で考えましょう! (一変数・単変量で正規分布に従う場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。 データ数が少ないため、偶然の要素を排除できません。今回は一変数のときに、"偶然の要素を排除できない" とはどういうこ...

テストデータ・バリデーションデータ(モデル検証用データ)におけるモデルの精度が低いときのポジティブな側面

回帰分析やクラス分類の話です。データセットがあるとき、まずモデル構築用データ (トレーニングデータ) とモデル検証用データ (テストデータ) に分けます。次にトレーニングデータで回帰モデル・クラス分類モデルを構築します。そして、モデル構築に...

ソフトセンサーの検討など時系列データを解析するとき用のモデルの評価指標 (改良版 r2) [金子研論文]

わたしもついに Beware of ... 系の論文を書いてしまいました。その名の通り、注意喚起する系の論文です。過去には他にこんなものがありました。 Beware of q2! Beware of R2: Simple, Unambigu...
タイトルとURLをコピーしました