モデルがどれくらい外挿できるか (モデルの適用範囲の外をどのくらい予測できる) の検証方法

回帰モデルでもクラス分類モデルでも、モデルを構築したら、そのモデルでどれくらいの外挿ができるか、つまりモデルの適用範囲 (Applicability Domain, AD) の外をどのくらい予測できるのか、はとても大事です。AD はモデルが...

小さなデータセットが抱える大きな問題

サンプル数が小さいデータセットには、データ解析で回帰分析やクラス分類をするとき、とてつもなく大きな問題があります。回帰分析やクラス分類における問題というと、精度の高いモデルが構築できないことを想像するかもしれません。逆です。精度の高いモデル...

このデータセットにはどの距離を用いればよいの??~ユークリッド距離・マンハッタン距離・チェビシェフ距離・マハラノビス距離~

データ解析において、サンプル同士がどれくらい似ているか、サンプル間の類似度を調べるため、距離が用いられます。サンプル間の距離が小さい = 2つのサンプルは似ている、ということです。距離といってもいろいろあります。たとえば、ユークリッド距離・...

モデルの解釈に関する考え方・スタンス

金子研オンラインサロンにおける話題の中から一つ。Slack で機械学習によって構築されたモデルの解釈に関する質問があり、わたしが回答しました。質問や回答の詳細は伏せますが (興味のある方はオンラインサロンにご登録くださいw) モデルの解釈に...

緒言って何??何を書けばいいの??背景とか はじめに とか要旨とか概要とは違うの!?

論文や雑誌を読んでいると、緒言 (Introduction, イントロダクション) の章がありますよね。読むときはあまり意識しないかも知れませんが、いざ自分で論文を書こうとなると、緒言には何を書けばよいの??ってなりませんか?背景 (Bac...

主成分分析(Principal Component Analysis, PCA)の前に変数の標準化(オートスケーリング)をしたほうがよいのか?

変数がたくさんある多変量データを解析する前に、変数の標準化 (オートスケーリング) をすることは、こちらに書きました。データセットの可視化手法であり低次元化手法でもある主成分分析 (Principal Component Analysis,...

2018年度「化学プロセスシステム工学」の講義資料を(ほぼ)すべて公開します

2018年度の秋学期において、「化学プロセスシステム工学」の講義を行いました。主にプロセスモデリングやプロセス制御についてです。こここでは、その講義資料の pdf ファイルを公開します。2017年度の講義資料も公開しましたが、資料を改良して...

学生が論文を書くことの、学生にとっての 10 のメリット

一般的には、研究成果が出たら、その内容を論文化して学術誌に投稿します。ただ、一つ論文を書くのも一苦労です。論文書くの面倒だなあ・・・と思う人もいるのではないでしょうか。学生にとっては、学位を取得するために論文が必要な場合を除いては、論文を書...

2018年度金子研オンラインサロンメンバー限定 データ化学工学研究室(金子研究室)成果報告会を終えて

1月29日 (火) に、金子研オンラインサロンメンバー限定のデータ化学工学研究室 (金子研究室) 成果報告会を行ってまいりました。最終的なプログラムは以下のとおりです。===金子研オンラインサロンメンバー限定2018年度データ化学工学研究室...

2018年度「分離化学工学」の講義資料を(ほぼ)すべて公開します

2018年度の春学期において、「分離化学工学」の講義を行いました。ここでは、その講義資料の pdf ファイルを公開します。2017年度の講義資料も公開しましたが、2018年度版は資料をさらに改良してわかりやすくしたつもりです。参考になる方は...
タイトルとURLをコピーしました