ケモメトリックス

主成分分析(Principal Component Analysis, PCA)~データセットの見える化・可視化といったらまずはこれ!~

主成分分析(Principal Component Analysis, PCA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PCAで何ができるか、どのようにPCAを計算するかが説明されています。pd...

モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~

統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、 いくつサンプルがあったらモデルはできますか? ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について...

【決意表明】金子研は第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参戦します!

退路を断つため、決意表明します。データ化学工学研究室(金子硏)のメンバーで1つのグループとして、第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参加することに致しました! このコンテストで参加グループは、与えられたおよそ25...

最小二乗法による線形重回帰分析~人工知能・機械学習・統計の基礎の基礎~

最小二乗法による線形重回帰分析について、pdfとパワーポイントの資料を作成しました。目的変数と説明変数とのデータセットが与えられたときに、どのように回帰係数を計算するかが説明されています。最後には回帰モデルを比較するための指標3つをまとめて...

コスパで読み解く、第5回ケモインフォマティクス若手の会~発表を聴くだけが学会ではありませんよ!~

2017年5月16日(火)の第5回ケモインフォマティクス若手の会@渋谷ヒカリエ に参加してきました。わたしはコアメンバーの1人なので運営サイドでもあります (最初にあいさつさせていただきました)。渋谷ヒカリエという、サイエンスの学会としては...

データセットをそのまま解析してエラーになってしまう方へ、基本的なデータの前処理方法を紹介します!

データセットを読み込んだあとに、まずやったほうがよい基本的なデータの前処理についてです。 最低限、この前処理は行いましょう! とりあえずオートスケーリング (標準化) しましょうとか、いやいやその前に情報量のない変数は消しておきましょうとか...

第5回ケモインフォマティクス若手の会におけるディスカッション用の資料をダウンロードできます!

2017年5月16日(火)に第5回ケモインフォマティクス若手の会があります。そこでワールドカフェ形式のグループディスカッションがありまして、わたしも話題提供をさせていただきます。 タイトルは、こちらにありますように 変数選択手法っていろいろ...

これであなたもデータサイエンティスト!?~Python入門のためのプログラミング課題と模範解答~(逐次更新)

データ化学工学研究室(金子研)では、新しく配属になった学生にいろいろなトレーニングをしています。その1つがPython言語のトレーニングです。化学構造を扱ったりデータ解析・機械学習をしたりするときに、Python言語を使うわけです。 Pyt...
タイトルとURLをコピーしました