ケモインフォマティクス

【生データあり】Chemoinformatics, 化学工学, プロセス管理に関係する論文誌のimpact factor, 論文数, キーワード出現論文数・率 まとめ(2014, 2015, 2016)

いろいろな論文誌について、2014, 2015, 2016年の状況をWeb of Scienceで調べた内容を報告します。 対象の論文誌は下のとおりです。 Journal of Chemical Information and Modeli...

自己組織化マップ(Self-Organizing Map, SOM)~非線形の可視化・見える化手法、ただ過学習の危険性も高いので注意!~

自己組織化マップ(Self-Organizing Map, SOM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SOMで何ができるか、RFをどのように計算するか、SOMの特徴・問題点・解決策が説明さ...

データの可視化・見える化のための手法を選ぶときの2つのポイント

データは、基本的に下図のように多次元で表現されていますので、 (次元の数は、変数の数とお考えください。厳密には異なりますが、だいたい同じです。) 工夫をしないとデータセットの全体像を見ることはできません。 下図のように、多次元空間に存在する...

ランダムフォレスト(Random Forests, RF)~アンサンブル学習で決定木の推定性能を向上!~

ランダムフォレスト(Random Forest, RF)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、RFで何ができるか、RFをどのように計算するかが説明されています。pdfもスライドも自由にご利用く...

決定木(Decision Tree, TD)~直感的に分かりやすいモデル~

決定木(Decision Tree, TD)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、決定木で何ができるか、決定木をどのように計算するかが説明されています。pdfもスライドも自由にご利用ください。...

半教師あり学習 (半教師付き学習) の4つのメリット (回帰分析・クラス分類)

機械学習の手法、統計的・情報学的手法の中には、教師なし学習や教師あり学習があります。教師なし学習では、変数を使ってサンプル群を可視化(見える化)したり、クラスター解析(クラスタリング)したりします。教師あり学習では、物性・活性などの目的変数...

どんなときにデータ解析・データ分析で成果がでやすいか?

データ解析の成功事例を聞いてチャレンジしたい気持ちになったけど、いざ検討するとなるとそれなりにコストもかかりますよね。 手元にデータはあるけど、解析して本当にうまくいくのか?(成果はでるのか?) うまくいきそうならプログラミング勉強しようか...

サポートベクター回帰(Support Vector Regression, SVR)~サンプル数10000以下ならこれを使うべし!~

サポートベクター回帰(Support Vector Regression, SVR)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVRで何ができるか、SVRの特徴、どのように計算するかが説明されてい...

リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN)~誤差の二乗和と一緒に回帰係数の値も小さくする~

リッジ回帰(Ridge Regression, RR), Least Absolute Shrinkage and Selection Operator (LASSO), Elastic Net (EN) について、pdfとパワーポイントの...

実験計画法の概要~データを上手く使って実験のコスパを上げましょう!~

たとえば、化学反応 A + B → C + D の、 C の収率を上げることを考えます。収率がもっとも高くなる実験条件を見つけることが目標です。 実験条件の1つである反応温度を 25℃ にして実験してみましょう。人間は精密機械ではありません...
タイトルとURLをコピーしました