自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~ 自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ... 2017.07.23 ケモインフォマティクスケモメトリックスデータ解析研究室
データの可視化・見える化のための手法を選ぶときの2つのポイント データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する... 2017.07.22 ケモインフォマティクスケモメトリックスデータ解析研究室
ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~ ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く... 2017.07.18 ケモインフォマティクスケモメトリックスデータ解析研究室
決定木(Decision Tree, TD)~直感的に分かりやすいモデル~ 決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。... 2017.07.17 ケモインフォマティクスケモメトリックスデータ解析研究室
実験レポートと学術論文との2つの違い もう少し詳しく書いておきます。 課題・問題 大量に採点する必要 実験レポート 与えられている ある 学術論文 与えられていない ない まず実験レポートには、課題・問題がすでに与えられています。課題があって、その課題に対する方針も(程度の差は... 2017.07.17 研究室雑記
プラットフォームとしての研究室 まずは研究室とそのメンバーとの関係を明文化できるきっかけとなった、キングコング 西野亮廣さんのブログを2つほど。 タレントは、スタッフから嫌われてしまうと仕事が無くなるので、「使いやすいタレント(より良いソフト)」になる努力を始めます。 し... 2017.07.16 研究室
明治大学 講義「分離化学工学」での学生からの質問まとめ わたしの分離化学工学の講義では、Googleフォームにて毎週 学生から質問を受け付けています。そこで出たすべての質問に答える、ということを “自分ルール” にしていました。分離化学工学も来週の定期試験を残すのみになり、無事に自分ルールをクリ... 2017.07.15 化学工学講義
大学の研究室における研究と教育 データ化学工学研究室(金子研)では、研究のためのトレーニングが一段落すると、徐々に学生ひとりひとりが研究にシフトしていきます。ただし、大学の研究室ですので、研究だけでなく教育も重要です。そのため、研究を通した教育・教育を通した研究、というこ... 2017.07.09 研究室
半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類) 機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数... 2017.07.08 ケモインフォマティクスケモメトリックスデータ解析化学工学研究室
どんなときにデータ解析・データ分析で成果がでやすいか? データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか... 2017.07.02 ケモインフォマティクスケモメトリックスデータ解析化学工学研究室