ケモインフォマティクス

GAPLS, GASVR でモデルの推定性能がよくなるように説明変数の選択をしよう![Pythonコードあり]

遺伝的アルゴリズム (Genetic Algorithm, GA) を使って説明変数を選択する話です。2つの手法である Genetic Algorithm-based Partial Least Squares (GAPLS) Geneti...

非線形モデルの解釈をしよう!~非線形モデルを各変数で偏微分~

線形のクラス分類モデル・回帰分析モデルでは、説明変数 (記述子・特徴量) ごとに重みが求まります。実際には説明変数の間には相関関係があるためモデルの解釈は簡単ではありませんが、重みを見ることでそのモデルを解釈した気になれます。 ただ、非線形...

Locally-Weighted Partial Least Squares (LWPLS, 局所PLS) ~あのPLSが非線形性に対応!~ [Python・MATLABコードあり]

Partial Least Squares (PLS) を変数間の非線形性に対応させた Locally-Weighted Partial Least Squares (LWPLS, 局所PLS) について、pdfとパワーポイントの資料を作成...

実験計画法で実験パラメータの候補を選択する (直交表を作成する) プログラムを公開します

今回は、実験計画法についてです。実験計画法の概要についてはこちらをご覧ください。 実験パラメータがあり、それぞれの候補の値が与えられているときに、決められた数の組み合わせを選択するプログラムを作成しましたので公開します。Python や M...

t-distributed Stochastic Neighbor Embedding (t-SNE) ~データの可視化に特化した手法~

今回は、t-distributed Stochastic Neighbor Embedding (t-SNE)についてです。変数 (特徴量・記述子など) がたくさんある (多変量・多次元の) データセットが与えられたときに、適切に2次元平面...

T2統計量・Q統計量~異常値を検出したり、モデルの適用範囲・適用領域(AD)を設定したり~

今回は、T2統計量・Q統計量についてです。主成分分析 (Principal Component Analysis, PCA) を行ったあとに、異常値を検出したり、モデルの適用範囲・適用領域 (Applicability Domain, AD...

第7回ケモインフォマティクス若手の会に金子研の学生たちと参加してきました

2018年5月22日 (火) に第7回ケモインフォマティクス若手の会@渋谷ヒカリエ に参加して参りました。金子研の学生たちも一緒です。修士一年の3人は、グループディスカッションの話題提供もしました。 小島巧, 金子弘昌, “時間軸を用いたソ...

モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) ~回帰モデル・クラス分類モデルを使うとき必須となる概念~

今回は、モデルの適用範囲・モデルの適用領域 (Applicability Domain, AD) についてです。AD は回帰モデル・クラス分類モデルが本来の性能を発揮できるデータ領域のことです。回帰モデル・クラス分類モデルを使うとき必須にな...

第7回ケモインフォマティクス若手の会におけるディスカッション用の資料を公開~Generative Topographic Mapping(GTM)でデータの可視化・回帰分析・モデルの逆解析を一緒にやってみた~

2018年5月22日(火)に第7回ケモインフォマティクス若手の会があります。当日は講演をさせていただくのですが、ワールドカフェ形式のグループディスカッションもありまして、そこでも話題提供をします。 タイトルは、こちらにありますように Gen...

単純ベイズ分類器 (ナイーブベイズ, Naïve Bayes Classifier) でクラス分類

今回は、単純ベイズ分類器 (ナイーブベイズ, Naïve Bayes Classifier) についてです。ナイーブベイズにより多クラス分類ができます。推定結果として、各クラスに属する確率で得られるため、推定結果が得られた後の検討がしやすい...
タイトルとURLをコピーしました