データ解析

サポートベクターマシン(Support Vector Machine, SVM)~優秀な(非線形)判別関数~

サポートベクターマシン(Support Vector Machine, SVM)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、SVMで何ができるか、どのようにSVMを計算するかが説明されています。pd...

線形判別分析(Linear Discriminant Analysis, LDA)~多クラスにも応用できる線形クラス分類~

線形判別分析(Linear Discriminant Analysis, LDA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、LDAで何ができるか、どのようにLDAを計算するかが説明されています。p...

部分的最小二乗回帰(Partial Least Squares Regression, PLS)~回帰分析は最初にこれ!~

部分的最小二乗回帰 (Partial Least Squares Regression, PLS) について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PLSで何ができるか、どのようにPLSを計算するかが説...

主成分分析(Principal Component Analysis, PCA)~データセットの見える化・可視化といったらまずはこれ!~

主成分分析(Principal Component Analysis, PCA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PCAで何ができるか、どのようにPCAを計算するかが説明されています。pd...

モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~

統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、いくつサンプルがあったらモデルはできますか?ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について説明...

【決意表明】金子研は第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参戦します!

退路を断つため、決意表明します。データ化学工学研究室(金子硏)のメンバーで1つのグループとして、第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参加することに致しました!このコンテストで参加グループは、与えられたおよそ250...

最小二乗法による線形重回帰分析~人工知能・機械学習・統計の基礎の基礎~

最小二乗法による線形重回帰分析について、pdfとパワーポイントの資料を作成しました。目的変数と説明変数とのデータセットが与えられたときに、どのように回帰係数を計算するかが説明されています。最後には回帰モデルを比較するための指標3つをまとめて...

コスパで読み解く、第5回ケモインフォマティクス若手の会~発表を聴くだけが学会ではありませんよ!~

2017年5月16日(火)の第5回ケモインフォマティクス若手の会@渋谷ヒカリエ に参加してきました。わたしはコアメンバーの1人なので運営サイドでもあります (最初にあいさつさせていただきました)。渋谷ヒカリエという、サイエンスの学会としては...

データセットをそのまま解析してエラーになってしまう方へ、基本的なデータの前処理方法を紹介します!

データセットを読み込んだあとに、まずやったほうがよい基本的なデータの前処理についてです。最低限、この前処理は行いましょう!とりあえずオートスケーリング (標準化) しましょうとか、いやいやその前に情報量のない変数は消しておきましょうとか、そ...

第5回ケモインフォマティクス若手の会におけるディスカッション用の資料をダウンロードできます!

2017年5月16日(火)に第5回ケモインフォマティクス若手の会があります。そこでワールドカフェ形式のグループディスカッションがありまして、わたしも話題提供をさせていただきます。タイトルは、こちらにありますように変数選択手法っていろいろある...
タイトルとURLをコピーしました