プログラミング

[Pythonコードあり] ベイズ最適化で所望の物性や活性となる確率の高い化学構造を生成する (物性・活性が2つ以上でもOK)

Structure Generator based on R-Group (SGRG) という化学構造を生成する Python プログラムへの、新たな機能追加です。今回の機能追加でバージョンを 1.0 → 2.0 としました。 SGRG に...

[Pythonコード付き] 相関係数で変数選択したり変数のクラスタリングをしたりしてみましょう

回帰分析やクラス分類をする前の、データセットの前処理の話です。2 つの説明変数 (記述子・特徴量) の間で、相関係数の絶対値が大きいとき、それらの変数は似ているということです。余計な変数は、回帰モデル・クラス分類モデルに悪影響を及ぼすため、...

共同研究・コンサルティングの相談や技術相談をご検討の方は、こちらをご一読いただけますと幸いです

共同研究・コンサルティングや技術相談のご検討をいただき、感謝申し上げます。一度 金子に会って相談したい、という方もいらっしゃると思います。とてもうれしいことです。ただ、とても多くの方から相談を受けていたり、その中で実際に共同研究・コンサルテ...

[デモのプログラムあり] 勾配ブースティングGradient Boosting、特に Gradient Boosting Decision Tree (GBDT), XGBoost, LightGBM

勾配ブースティングGradient Boosting、特に Gradient Boosting Decision Tree (GBDT), XGBoost, LightGBM について、パワーポイントの資料とその pdf ファイルを作成しま...

RDKit をインストールできなかったり import できなかったりしたときの対処法まとめ (Anaconda ユーザー向け)

分子の化学構造を扱うためのソフトウェア RDKit を Python で利用するためのインストールについてです。こちらの Python プログラミングの課題でも 18 から 20 までは RDKit を活用した課題です。 分子設計をするとき...

MATLAB に慣れた人が Python を始めるときの11の注意点

この記事では、MATLAB にある程度慣れている人の中で、これから Python をはじめる人を対象としています。両方ともプログラミング言語で似ているところもあるため、0 から Python をはじめるよりは MATLAB を経験していたほ...

データ解析・機械学習をはじめたいとき、市販のソフトウェアを使うのがよいか、プログラミングを勉強するのがよいか、それぞれのメリット・デメリットを考える

手持ちのデータを解析したり、データを用いて機械学習したりしたいとき、大きく分けて2つの方法があります。 データ解析や機械学習ができるソフトウェアを用いる プログラミングを学び、データ解析や機械学習をする です。ソフトウェアは、「データ解析 ...

Anaconda のインストールから jupyter notebook の起動まで (Windows編とmacOS編)

Python でプログラミングするときの事前準備の話です。Anaconda をインストールして jupyter notebook を使いたい方はぜひご覧ください。Windows 編と macOS 編があります。ご自身の OS にあわせてどう...

サンプルが少ないときはどうするか?・・・うーん、仕方がないのでデータ分布を仮定してたくさんサンプリングしましょう! (多変量の場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。 今回は変数が複数 (多変量) のときです。ちなみに変数がひとつ (単変量) のときはこちらです。 多変量でも、データ...

Sparse Generative Topographic Mapping(SGTM): データの可視化とクラスタリングを一緒に実行する方法 [金子研論文]

今回は、Sparse Generative Topographic Mapping (SGTM) という、GTM のアルゴリズムを改良することで、データの可視化をすると同時に、クラスタリングも一緒に実行できる手法についてです。この手法を開発...
タイトルとURLをコピーしました