プログラミング

[Pythonコードあり] 特徴量ごとや特徴量間に制限があるときの、モデルの逆解析用のサンプル生成

回帰モデルやクラス分類モデルを構築した後の、モデルの逆解析の話です。上の 既存のサンプルの分布に従うように、モデルの逆解析用のサンプルをたくさん生成する方法 では、既存のサンプルのデータ分布を求めて、その分布に従うようにして新たなサンプルを...

プログラミングを始めるときに入門書を使うべきか、使わないべきか

「プログラミングをはじめたいのですが、入門書はどれがよいですか?」「学生が使っているプログラミングの入門書はどれですか?」といった質問をよくいただきます。実は、金子研でオススメのプログラミング入門書があるわけではなく、学生に入門書を使うよう...

「化学のためのPythonによるデータ解析・機械学習入門」 正誤表

Amazon をはじめとして、在庫の補充が遅れており申し訳ございません。発売 3 日後に重版がかかるなど、理工学書としてこれまでにない売れ行きだそうで、出版社もバタバタしているとのことです。もう少しお待ちいただけますと幸いです。そんな中、金...

プログラミングのボトルネックは、プログラミングではないところにあり!

金子研では学生もわたしも、プログラミング言語は基本的に Python を使っています。文法はシンプルでわかりやすいですし、ライブラリも豊富でとても便利です。基本的に学生たちは 4 年生で研究室に配属されるまで、プログラミングは行いませんので...

[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門」 の “はじめに” と目次の詳細

こちらの書籍には改訂2版がございます。改訂2版でも無料公開の部分の内容は変わらない一方で、一章分+α を改訂2版では追記しておりますので、以下で興味を持っていただけましたら、改訂2版の購入をオススメいたします。2019 年 10 月 23 ...

[高分子設計]モノマーの構造から二量体・三量体・・・を生成するPythonプログラムを作りましたのでぜひご活用ください

こちらの Github にモノマーの構造から多量体を作成するPythonプログラム make_repeating_unit_homo.py を共有します。まず、モノマーの構造を monomer.mol という mol ファイルを準備します。...

DCEKit にバギングによるアンサンブル学習の機能を追加!scikit-learn の BaggingRegressor や BaggingClassifier との違いとは?

データ解析・機械学習のためのツールキット DCEKit にバギングによるアンサンブル学習の機能を追加しました。アンサンブル学習というのは、回帰モデルだったりクラス分類モデルだったり、モデルをたくさん作って推定性能を上げよう!、といった手法で...

DCEKit (Data Chemical Engineering toolKit) のクラスや関数の解説 (取扱説明書)

こちらのDCEKit (Data Chemical Engineering toolKit) について、クラスや関数の解説をします。少し長いですが、「Ctrl + F」で知りたいクラス・関数の名前を検索してもらえるとうれしいです。黄色のマー...

DCEKit (Data Chemical Engineering toolKit) を PyPI にリリース!

これまで化学データ・化学工学データのデータ解析に役立つツールや金子研で開発された手法に関する Python コードを Github にて公開してきました。このたびは、これらのツール・手法 (の一部) に加えて、新たな機能を追加して、DCEK...

[Pythonコード付き] テストデータのMAEをトレーニングデータから推定する方法を開発したので紹介します [金子研論文]

回帰分析において、新しいサンプルを推定するときの誤差の絶対値の平均値を推定するための指標を開発しました。イメージとしては、テストデータとしてサンプルがたくさんあるときの、モデルの適用範囲 (Applicability Domain, AD)...
タイトルとURLをコピーしました