自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~ 自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ... 2017.07.23 ケモインフォマティクスケモメトリックスデータ解析研究室
データの可視化・見える化のための手法を選ぶときの2つのポイント データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する... 2017.07.22 ケモインフォマティクスケモメトリックスデータ解析研究室
ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~ ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く... 2017.07.18 ケモインフォマティクスケモメトリックスデータ解析研究室
決定木(Decision Tree, TD)~直感的に分かりやすいモデル~ 決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。... 2017.07.17 ケモインフォマティクスケモメトリックスデータ解析研究室
半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類) 機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数... 2017.07.08 ケモインフォマティクスケモメトリックスデータ解析化学工学研究室
どんなときにデータ解析・データ分析で成果がでやすいか? データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか... 2017.07.02 ケモインフォマティクスケモメトリックスデータ解析化学工学研究室
サポートベクター回帰(Support Vector Regression, SVR)~サンプル数10000以下ならこれを使うべし!~ サポートベクター回帰(Support Vector Regression, SVR)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVRで何ができるか、SVRの特徴、どのように計算するかが説明されてい... 2017.07.01 ケモインフォマティクスケモメトリックスデータ解析研究室
リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN)~誤差の二乗和と一緒に回帰係数の値も小さくする~ リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN) について、pdfとパワーポイントの... 2017.06.28 ケモインフォマティクスケモメトリックスデータ解析研究室
実験計画法の概要~データを上手く使って実験のコスパを上げましょう!~ たとえば、化学反応 A + B → C + D の、 C の収率を上げることを考えます。収率がもっとも高くなる実験条件を見つけることが目標です。 実験条件の1つである反応温度を 25℃ にして実験してみましょう。人間は精密機械ではありません... 2017.06.25 ケモインフォマティクスケモメトリックスデータ解析化学工学研究室
サポートベクターマシン(Support Vector Machine, SVM)~優秀な(非線形)判別関数~ サポートベクターマシン(Support Vector Machine, SVM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVMで何ができるか、どのようにSVMを計算するかが説明されています。pd... 2017.06.23 ケモインフォマティクスケモメトリックスデータ解析研究室