自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~

自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ...

データの可視化・見える化のための手法を選ぶときの2つのポイント

データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する...

ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~

ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く...

決定木(Decision Tree, TD)~直感的に分かりやすいモデル~

決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。...

実験レポートと学術論文との2つの違い

もう少し詳しく書いておきます。 課題・問題 大量に採点する必要 実験レポート 与えられている ある 学術論文 与えられていない ない まず実験レポートには、課題・問題がすでに与えられています。課題があって、その課題に対する方針も(程度の差は...

プラットフォームとしての研究室

まずは研究室とそのメンバーとの関係を明文化できるきっかけとなった、キングコング 西野亮廣さんのブログを2つほど。 タレントは、スタッフから嫌われてしまうと仕事が無くなるので、「使いやすいタレント(より良いソフト)」になる努力を始めます。 し...

明治大学 講義「分離化学工学」での学生からの質問まとめ

わたしの分離化学工学の講義では、Googleフォームにて毎週 学生から質問を受け付けています。そこで出たすべての質問に答える、ということを “自分ルール” にしていました。分離化学工学も来週の定期試験を残すのみになり、無事に自分ルールをクリ...

大学の研究室における研究と教育

データ化学工学研究室(金子研)では、研究のためのトレーニングが一段落すると、徐々に学生ひとりひとりが研究にシフトしていきます。ただし、大学の研究室ですので、研究だけでなく教育も重要です。そのため、研究を通した教育・教育を通した研究、というこ...

半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類)

機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数...

どんなときにデータ解析・データ分析で成果がでやすいか?

データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか...
タイトルとURLをコピーしました