金子研の新人トレーニングで伝えたこと 4/n

今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。

金子研の新人トレーニングで伝えたこと 1/n
データ化学工学研究室 (金子研) では毎年、金子研に配属された学生に向けて、3年生の2月から事前の新人トレーニングがスタートします (留学などの予定がある方はそちら優先)。3年生には「課題」があり、各自行っていただきます。その進捗については...
金子研の新人トレーニングで伝えたこと 2/n
今週も進捗報告会がありました。前回の第1回の報告会でお話しした内容はこちらです。今回は第2回目でお話しした内容をまとめておきます。 エクセルで作成した xlsx ファイルをテキストエディタで開いた時に起こる現象や、ワードで作成した docx...
金子研の新人トレーニングで伝えたこと 3/n
今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。今回は第3回目でお話しした内容をまとめておきます。 結果を示す時に、図で示した方が良いか、表で示した方が分かりやすいか検討しましょう 特に複数の数値がそれぞれ関連し...

 

今回は第4回目でお話しした内容をまとめておきます。

  • クラスタリングは、高次元空間におけるデータセットの解釈のサポートです
  • 二次元 (もしくは三次元) で可視化できるのであれば、主観的に “クラスタリング” しても問題ありません
  • 主成分分析などの次元削減手法でうまく二次元 (もしくは三次元) で表現できない時は、クラスタリングでデータセットの解釈をサポートします
  • 散布図を見る時は、”各点” の意味を考えましょう
  • 目的変数の実測値 予測値のプロットを確認するときは、目的変数の値ごと、サンプルごとに誤差を見るなど解像度を上げましょう
  • 散布図では分布の情報が抜け落ちてしまうため、ヒストグラムも活用しましょう
  • 何らかの推移を線のプロットで確認する図において、具体的に値がある状況では線だけでなく点を付けましょう
  • トレーニングデータの目的変数の値と、モデルの逆解析における目的変数の予測結果とが一致しない理由を考えてみましょう
  • 多重共線性の問題は、PFC バランスで説明できます

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました