dcelab

回帰分析のときにアンサンブル学習で自動的かつロバストに外れサンプルを見つける Python プログラムを公開します

今回は外れサンプルを検出するお話です。外れ値ではなく外れサンプルです。外れ値は、他の値と (大きく) 離れた値のことであり、外れ値がデータ解析のときに悪影響を及ぼすことがあります。ただ、回帰分析のときには、大事なのは説明変数 X と目的変数...

共同研究・コンサルティングの相談や技術相談をご検討の方は、こちらをご一読いただけますと幸いです

共同研究・コンサルティングや技術相談のご検討をいただき、感謝申し上げます。一度 金子に会って相談したい、という方もいらっしゃると思います。とてもうれしいことです。ただ、とても多くの方から相談を受けていたり、その中で実際に共同研究・コンサルテ...

適応型ソフトセンサーを検証できる Python コードを作りましたので、ぜひご自身のデータセットでお試しください

化学プラント・産業プラントにおける測定が難しいプロセス変数の値を、機械学習・人工知能で推定しよう! というのがソフトセンサーですが、 プラントでソフトセンサーを用いるときは、基本的に適応型ソフトセンサー (Adaptive Soft Sen...

4, 5, 6 月ころゼミで学生の成長のためにやっていること・考えていること

今年も 4 月から金子研 (データ化学工学研究室) のゼミが本格的にスタートしました。学生の成長のため、あれこれ考えながらゼミを行っております。学生の成長ばかりで研究成果のことはいいの??って方は、こちらをご覧ください。 ゼミの内容に関して...

SVR(サポートベクター回帰)で誤差が一定のところにサンプルが固まるのはどうして?何か問題があるの? → SVR の特徴も確認!

SVR (Support Vector Regression, サポートベクター回帰) で回帰モデルを構築したことのある方は、下の図のように、実測値 vs. 推定値プロットにおいて、対角線から一定に離れたところにサンプルが固まっている、つま...

化学構造・分子・化合物の扱いに関する基本的なこと

データセットがあると、データセットの可視化・クラスタリング・クラス分類・回帰分析などができるようになったり、モデルの適用範囲を設定したり、実験計画法により実験候補を選択できます。こちらにいろいろな手法の説明があります。 ただ、どの手法を使う...

[デモのプログラムあり] 勾配ブースティングGradient Boosting、特に Gradient Boosting Decision Tree (GBDT), XGBoost, LightGBM

勾配ブースティングGradient Boosting、特に Gradient Boosting Decision Tree (GBDT), XGBoost, LightGBM について、パワーポイントの資料とその pdf ファイルを作成しま...

本音ベースの座談会。金子研の学生たちと就活や大学院進学について話し合ってみました

金子研の学生 3 人と、就活や大学院進学について座談会をしました。登場する 3 人は以下のとおりです。 M2 小島・・・学部生の頃に就活するも、気が変わって大学院に進学。M2の学生として就活中 M1 江尾・・・大学院に進学 社会人一年目 (...

RDKit をインストールできなかったり import できなかったりしたときの対処法まとめ (Anaconda ユーザー向け)

分子の化学構造を扱うためのソフトウェア RDKit を Python で利用するためのインストールについてです。こちらの Python プログラミングの課題でも 18 から 20 までは RDKit を活用した課題です。 分子設計をするとき...

化学工学会 第84年会と日本化学会 第99春季年会で研究発表をしてきました

2019年3月13日から15日まで芝浦工業大学 豊洲キャンパスで開催された化学工学会 第84年会と、3月16日から19日まで甲南大学 岡本キャンパスで開催された日本化学会 第99春季年会で、学生と一緒に研究発表をしてまいりました。 化工学会...
タイトルとURLをコピーしました