データ解析

Stepwise (ステップワイズ) 法による説明変数 (入力変数・記述子・特徴量) の選択~手軽な変数選択手法~

Stepwise (ステップワイズ) 法による変数選択について、pdfとパワーポイントの資料を作成しました。Stepwiseの特徴や、データセットが与えられたときにStepwiseで何ができるか、Stepwiseをどのように計算するかが説明...

回帰モデル・クラス分類モデルを評価・比較するためのモデルの検証 (Model validation)

いろいろな回帰モデル・クラス分類モデルを構築したり、モデルの中のハイパーパラメータ (PLSの成分数など) を決めたりするとき、モデルを評価・比較しなければなりません。そのためのモデルの検証 (model validation) の方法につ...

高校数学の知識から、人工知能・機械学習・データ解析へつなげる、必要最低限の教科書

『高校数学の知識から、人工知能・機械学習・データ解析へつなげる、必要最低限の教科書』です。必要な項目については順次追記していきます。 pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。 スライド...

Generative Topographic Mapping (GTM)~自己組織化マップ(SOM)の上位互換の手法~

Generative Topographic Mapping (GTM) について、pdfとパワーポイントの資料を作成しました。GTMの特徴や、データセットが与えられたときにGTMで何ができるか、GTMをどのように計算するかが説明されていま...

ガウス過程回帰(Gaussian Process Regression, GPR)~予測値だけでなく予測値のばらつきも計算できる!~

ガウス過程による回帰(Gaussian Process Regression, GPR)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、GPRで何ができるか、GPRをどのように計算するかが説明されていま...

【生データあり】Chemoinformatics, 化学工学, プロセス管理に関係する論文誌のimpact factor, 論文数, キーワード出現論文数・率 まとめ(2014, 2015, 2016)

いろいろな論文誌について、2014, 2015, 2016年の状況をWeb of Scienceで調べた内容を報告します。 対象の論文誌は下のとおりです。 Journal of Chemical Information and Modeli...

自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~

自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ...

データの可視化・見える化のための手法を選ぶときの2つのポイント

データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する...

ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~

ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く...

決定木(Decision Tree, TD)~直感的に分かりやすいモデル~

決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。...
タイトルとURLをコピーしました