金子研の新人トレーニングで伝えたこと 5/n

今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。

金子研の新人トレーニングで伝えたこと 1/n
データ化学工学研究室 (金子研) では毎年、金子研に配属された学生に向けて、3年生の2月から事前の新人トレーニングがスタートします (留学などの予定がある方はそちら優先)。3年生には「課題」があり、各自行っていただきます。その進捗については...
金子研の新人トレーニングで伝えたこと 2/n
今週も進捗報告会がありました。前回の第1回の報告会でお話しした内容はこちらです。今回は第2回目でお話しした内容をまとめておきます。 エクセルで作成した xlsx ファイルをテキストエディタで開いた時に起こる現象や、ワードで作成した docx...
金子研の新人トレーニングで伝えたこと 3/n
今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。今回は第3回目でお話しした内容をまとめておきます。 結果を示す時に、図で示した方が良いか、表で示した方が分かりやすいか検討しましょう 特に複数の数値がそれぞれ関連し...
金子研の新人トレーニングで伝えたこと 4/n
今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。今回は第4回目でお話しした内容をまとめておきます。 クラスタリングは、高次元空間におけるデータセットの解釈のサポートです 二次元 (もしくは三次元) で可視化できる...

 

今回は第5回目でお話しした内容をまとめておきます。

  • 新しい方法を実施する時は、必ず従来の方法と比較しましょう
  • 考察は、具体的に数値を示しながら行いましょう
  • ある現象の理由を考えるときは、その理由の妥当性だけでなく、その理由だけで現象をすべて説明できるかも確認しましょう
  • 名称は正確に記入しましょう。例えば、components と number of componentsは全く別の意味になります
  • 実測値と予測値の散布図のプロットは、縦軸の長さと横軸の長さを揃えましょう
  • 複数の図を比較するときは、それぞれ横軸・縦軸の長さを揃えましょう
  • 外れ値を検出するかしないかは、最後は主観で判断することになります
  • テストデータの意味合いを考えましょう
  • 多重共線性は、モデルの解釈を困難にします

 

以上です。

質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました