ケモメトリックス

データの可視化・見える化のための手法を選ぶときの2つのポイント

データは、基本的に下図のように多次元で表現されていますので、(次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。)工夫をしないとデータセットの全体像を見ることはできません。下図のように、多次元空間に存在するサンプ...

ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~

ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く...

決定木(Decision Tree, TD)~直感的に分かりやすいモデル~

決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。...

半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類)

機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数...

どんなときにデータ解析・データ分析で成果がでやすいか?

データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか...

サポートベクター回帰(Support Vector Regression, SVR)~サンプル数10000以下ならこれを使うべし!~

サポートベクター回帰(Support Vector Regression, SVR)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVRで何ができるか、SVRの特徴、どのように計算するかが説明されてい...

リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN)~誤差の二乗和と一緒に回帰係数の値も小さくする~

リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN) について、pdfとパワーポイントの...

実験計画法の概要~データを上手く使って実験のコスパを上げましょう!~

たとえば、化学反応 A + B → C + D の、 C の収率を上げることを考えます。収率がもっとも高くなる実験条件を見つけることが目標です。実験条件の1つである反応温度を 25℃ にして実験してみましょう。人間は精密機械ではありませんし...

サポートベクターマシン(Support Vector Machine, SVM)~優秀な(非線形)判別関数~

サポートベクターマシン(Support Vector Machine, SVM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVMで何ができるか、どのようにSVMを計算するかが説明されています。pd...

線形判別分析(Linear Discriminant Analysis, LDA)~多クラスにも応用できる線形クラス分類~

線形判別分析(Linear Discriminant Analysis, LDA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、LDAで何ができるか、どのようにLDAを計算するかが説明されています。p...
タイトルとURLをコピーしました