すでに100万サンプル超え!?金子研ではこれまでどのようなデータセットを扱ってきたのか

これまで金子研では、学生たちやわたしが、いろいろな種類のデータセットを扱ってまいりました。参考までに、これまでのデータセットを、教師ありのサンプル数 (目的変数の値のあるサンプル数) と一緒にまとめました。共同研究に関するものなど、ぼやかして記載してあるデータもあります。

ちなみに教師ありのサンプル数の合計は 146万1943 です。数が大事なわけではありませんが、一つの目安として、これからも扱ったデータセットが増えましたら更新していきます。

 

  • 水溶解度データ     1290
  • 環境毒性データ     1213
  • 沸点データ          294
  • 融点データ          4333
  • 薬理活性データ     294
  • 薬理活性データ     423
  • 薬理活性データ     717
  • 反応系データ        80
  • 有機物データ        3572
  • 有機塩データ        297
  • 農薬系データ        136
  • エネルギー系データ  168
  • 毒性データ          185
  • 毒性データ          31
  • ポリマーデータ        359
  • ポリマーデータ        133
  • 超伝導体材料データ          21263
  • 色素増感型太陽電池データ  4405
  • 材料系データ        41
  • 材料系データ        82
  • 材料系データ        18
  • 材料系データ        4
  • スペクトルデータ     102
  • スペクトルデータ     228
  • スペクトルデータ     655
  • 樹脂系データ        42
  • 材料プロセスデータ  749895
  • 石炭データ          80
  • 仮想的プラント設計データ     40
  • デブタナイザーデータ 2394
  • 排煙脱硝装置データ          10081
  • 水処理系データ     24290
  • 水処理系データ     394360
  • 水処理系データ     11816
  • バッチプロセスデータ 36
  • 仮想的プラントデータ           31700
  • 連続プロセスデータ  155520
  • バッチプロセスデータ 41366

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました