これまで金子研では、学生たちやわたしが、いろいろな種類のデータセットを扱ってまいりました。参考までに、これまでのデータセットを、教師ありのサンプル数 (目的変数の値のあるサンプル数) と一緒にまとめました。共同研究に関するものなど、ぼやかして記載してあるデータもあります。
ちなみに教師ありのサンプル数の合計は 146万1943 です。数が大事なわけではありませんが、一つの目安として、これからも扱ったデータセットが増えましたら更新していきます。
- 水溶解度データ 1290
- 環境毒性データ 1213
- 沸点データ 294
- 融点データ 4333
- 薬理活性データ 294
- 薬理活性データ 423
- 薬理活性データ 717
- 反応系データ 80
- 有機物データ 3572
- 有機塩データ 297
- 農薬系データ 136
- エネルギー系データ 168
- 毒性データ 185
- 毒性データ 31
- ポリマーデータ 359
- ポリマーデータ 133
- 超伝導体材料データ 21263
- 色素増感型太陽電池データ 4405
- 材料系データ 41
- 材料系データ 82
- 材料系データ 18
- 材料系データ 4
- スペクトルデータ 102
- スペクトルデータ 228
- スペクトルデータ 655
- 樹脂系データ 42
- 材料プロセスデータ 749895
- 石炭データ 80
- 仮想的プラント設計データ 40
- デブタナイザーデータ 2394
- 排煙脱硝装置データ 10081
- 水処理系データ 24290
- 水処理系データ 394360
- 水処理系データ 11816
- バッチプロセスデータ 36
- 仮想的プラントデータ 31700
- 連続プロセスデータ 155520
- バッチプロセスデータ 41366
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。