部分的最小二乗回帰(Partial Least Squares Regression, PLS)~回帰分析は最初にこれ!~ 部分的最小二乗回帰 (Partial Least Squares Regression, PLS) について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PLSで何ができるか、どのようにPLSを計算するかが説... 2017.06.18 ケモインフォマティクスケモメトリックスデータ解析研究室
主成分分析(Principal Component Analysis, PCA)~データセットの見える化・可視化といったらまずはこれ!~ 主成分分析(Principal Component Analysis, PCA)について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PCAで何ができるか、どのようにPCAを計算するかが説明されています。pd... 2017.06.17 ケモインフォマティクスケモメトリックスデータ解析研究室
モデルを作るのにサンプル数はいくつ必要か?に対する回答~モデルの適用範囲・モデルの適用領域~ 統計だったり機械学習だったりニューラルネットワークだったり、データを使ったモデルの開発をしていますと、いくつサンプルがあったらモデルはできますか?ってよく聞かれます。今回はこの質問に答えながら、モデルの適用範囲・モデルの適用領域について説明... 2017.06.11 ケモインフォマティクスケモメトリックスデータ解析研究室
【決意表明】金子研は第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参戦します! 退路を断つため、決意表明します。データ化学工学研究室(金子硏)のメンバーで1つのグループとして、第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」に参加することに致しました!このコンテストで参加グループは、与えられたおよそ250... 2017.06.03 ケモインフォマティクスケモメトリックスデータ解析プログラミング研究室
最小二乗法による線形重回帰分析~人工知能・機械学習・統計の基礎の基礎~ 最小二乗法による線形重回帰分析について、pdfとパワーポイントの資料を作成しました。目的変数と説明変数とのデータセットが与えられたときに、どのように回帰係数を計算するかが説明されています。最後には回帰モデルを比較するための指標3つをまとめて... 2017.05.21 ケモインフォマティクスケモメトリックスデータ解析研究室
コスパで読み解く、第5回ケモインフォマティクス若手の会~発表を聴くだけが学会ではありませんよ!~ 2017年5月16日(火)の第5回ケモインフォマティクス若手の会@渋谷ヒカリエ に参加してきました。わたしはコアメンバーの1人なので運営サイドでもあります (最初にあいさつさせていただきました)。渋谷ヒカリエという、サイエンスの学会としては... 2017.05.19 ケモインフォマティクスケモメトリックスデータ解析学会研究発表
データセットをそのまま解析してエラーになってしまう方へ、基本的なデータの前処理方法を紹介します! データセットを読み込んだあとに、まずやったほうがよい基本的なデータの前処理についてです。最低限、この前処理は行いましょう!とりあえずオートスケーリング (標準化) しましょうとか、いやいやその前に情報量のない変数は消しておきましょうとか、そ... 2017.05.11 ケモメトリックスデータ解析プログラミング研究室
第5回ケモインフォマティクス若手の会におけるディスカッション用の資料をダウンロードできます! 2017年5月16日(火)に第5回ケモインフォマティクス若手の会があります。そこでワールドカフェ形式のグループディスカッションがありまして、わたしも話題提供をさせていただきます。タイトルは、こちらにありますように変数選択手法っていろいろある... 2017.05.08 ケモメトリックスデータ解析プログラミング研究発表
これであなたもデータサイエンティスト!?~Python入門のためのプログラミング課題と模範解答~(逐次更新) データ化学工学研究室(金子研)では、新しく配属になった学生にいろいろなトレーニングをしています。その1つがPython言語のトレーニングです。化学構造を扱ったりデータ解析・機械学習をしたりするときに、Python言語を使うわけです。Pyth... 2017.04.30 ケモメトリックスデータ解析プログラミング研究室