ケモインフォマティクス

高校数学の知識から、人工知能・機械学習・データ解析へつなげる、必要最低限の教科書

『高校数学の知識から、人工知能・機械学習・データ解析へつなげる、必要最低限の教科書』です。必要な項目については順次追記していきます。 pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。 スライド...

Generative Topographic Mapping (GTM)~自己組織化マップ(SOM)の上位互換の手法~

Generative Topographic Mapping (GTM) について、pdfとパワーポイントの資料を作成しました。GTMの特徴や、データセットが与えられたときにGTMで何ができるか、GTMをどのように計算するかが説明されていま...

ガウス過程回帰(Gaussian Process Regression, GPR)~予測値だけでなく予測値のばらつきも計算できる!~

ガウス過程による回帰(Gaussian Process Regression, GPR)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、GPRで何ができるか、GPRをどのように計算するかが説明されていま...

【生データあり】Chemoinformatics, 化学工学, プロセス管理に関係する論文誌のimpact factor, 論文数, キーワード出現論文数・率 まとめ(2014, 2015, 2016)

いろいろな論文誌について、2014, 2015, 2016年の状況をWeb of Scienceで調べた内容を報告します。 対象の論文誌は下のとおりです。 Journal of Chemical Information and Modeli...

自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~

自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ...

データの可視化・見える化のための手法を選ぶときの2つのポイント

データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する...

ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~

ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く...

決定木(Decision Tree, TD)~直感的に分かりやすいモデル~

決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。...

半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類)

機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数...

どんなときにデータ解析・データ分析で成果がでやすいか?

データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか...
タイトルとURLをコピーしました