データ解析

実験計画法の概要~データを上手く使って実験のコスパを上げましょう!~

たとえば、化学反応 A + B → C + D の、 C の収率を上げることを考えます。収率がもっとも高くなる実験条件を見つけることが目標です。 実験条件の1つである反応温度を 25℃ にして実験してみましょう。人間は精密機械ではありません...

サポートベクターマシン(Support Vector Machine, SVM)~優秀な(非線形)判別関数~

サポートベクターマシン(Support Vector Machine, SVM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVMで何ができるか、どのようにSVMを計算するかが説明されています。pd...

線形判別分析(Linear Discriminant Analysis, LDA)~多クラスにも応用できる線形クラス分類~

線形判別分析(Linear Discriminant Analysis, LDA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、LDAで何ができるか、どのようにLDAを計算するかが説明されています。p...

部分的最小二乗回帰(Partial Least Squares Regression, PLS)~回帰分析は最初にこれ!~

部分的最小二乗回帰 (Partial Least Squares Regression, PLS) について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PLSで何ができるか、どのようにPLSを計算するかが説...

主成分分析(Principal Component Analysis, PCA)~データセットの見える化・可視化といったらまずはこれ!~

主成分分析(Principal Component Analysis, PCA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PCAで何ができるか、どのようにPCAを計算するかが説明されています。pd...

モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~

統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、 いくつサンプルがあったらモデルはできますか? ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について...

【決意表明】金子研は第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参戦します!

退路を断つため、決意表明します。データ化学工学研究室(金子硏)のメンバーで1つのグループとして、第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参加することに致しました! このコンテストで参加グループは、与えられたおよそ25...

最小二乗法による線形重回帰分析~人工知能・機械学習・統計の基礎の基礎~

最小二乗法による線形重回帰分析について、pdfとパワーポイントの資料を作成しました。目的変数と説明変数とのデータセットが与えられたときに、どのように回帰係数を計算するかが説明されています。最後には回帰モデルを比較するための指標3つをまとめて...

コスパで読み解く、第5回ケモインフォマティクス若手の会~発表を聴くだけが学会ではありませんよ!~

2017年5月16日(火)の第5回ケモインフォマティクス若手の会@渋谷ヒカリエ に参加してきました。わたしはコアメンバーの1人なので運営サイドでもあります (最初にあいさつさせていただきました)。渋谷ヒカリエという、サイエンスの学会としては...

データセットをそのまま解析してエラーになってしまう方へ、基本的なデータの前処理方法を紹介します!

データセットを読み込んだあとに、まずやったほうがよい基本的なデータの前処理についてです。 最低限、この前処理は行いましょう! とりあえずオートスケーリング (標準化) しましょうとか、いやいやその前に情報量のない変数は消しておきましょうとか...
タイトルとURLをコピーしました