今週も進捗報告会がありました。これまでの報告会でお話しした内容はこちらです。

金子研の新人トレーニングで伝えたこと 1/n
データ化学工学研究室 (金子研) では毎年、金子研に配属された学生に向けて、3年生の2月から事前の新人トレーニングがスタートします (留学などの予定がある方はそちら優先)。3年生には「課題」があり、各自行っていただきます。その進捗については...

金子研の新人トレーニングで伝えたこと 2/n
今週も進捗報告会がありました。前回の第1回の報告会でお話しした内容はこちらです。今回は第2回目でお話しした内容をまとめておきます。 エクセルで作成した xlsx ファイルをテキストエディタで開いた時に起こる現象や、ワードで作成した docx...
今回は第3回目でお話しした内容をまとめておきます。
- 結果を示す時に、図で示した方が良いか、表で示した方が分かりやすいか検討しましょう
- 特に複数の数値がそれぞれ関連している場合は図で示したほうが分かりやすい
- 主成分分析による可視化の結果においては、必ず各主成分の寄与率を記入しましょう。寄与率が99%と1%では見方が全く異なります
- 第1主成分と第2主成分のみが必ずしも有効というわけではありません。第3主成分以降も確認するようにしましょう
- 主成分分析の結果を確認する際は、散布図だけでなくヒストグラムも有効
- 何らかの図を作成したら、少なくとも1分間は図を眺めてみて、どんな様子か、どんな特徴をもっているか、違和感はないか、もしあればどんな違和感か、などを考えてみましょう。そして、その考えを確認するためにデータをチェックしましょう
- クラスタリングとクラス分類の差異を明確にしましょう
- クラスタリングがどんな目的に使用されるのが適切か、どのような場面に有効か想像して考えてみましょう
- クラス分類の混同行列は、解像度を上げて確認しましょう
- 統計量を出す時には、有効数字にも気をつけましょう
- 回帰モデルの逆解析の結果で、目的変数の目標値の散布図において、k近傍法と線形回帰分析法とで違いが生じるのはなぜか、そしてそれぞれの特徴について考察してみましょう
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。
