dcelab

データ解析・機械学習をはじめたいとき、市販のソフトウェアを使うのがよいか、プログラミングを勉強するのがよいか、それぞれのメリット・デメリットを考える

手持ちのデータを解析したり、データを用いて機械学習したりしたいとき、大きく分けて2つの方法があります。 データ解析や機械学習ができるソフトウェアを用いる プログラミングを学び、データ解析や機械学習をする です。ソフトウェアは、「データ解析 ...

2018年度データ化学工学研究室(金子研究室)成果報告会をやります!

タイトルのとおりでして、金子研の学生たちが今年度に研究した成果を報告します。成果報告会と同じ週に応用化学科での四年生の卒業研究発表会がありまして、皆さん発表の完成度を上げていきますので、四年生もしっかりした発表になると思います。 成果報告会...

【失敗例】yの値を推定したいサンプルがモデルの適用範囲内に入るように変数選択と次元削減をすればいいのでは!?

これから書くことか過去の失敗例です。ご注意ください。 回帰モデルでもクラス分類モデルでも、あるデータセットに基づいてモデルが構築されたとします。そのモデルを用いて新しいサンプルの目的変数 y の値を推定するとき、新しいサンプルがモデル構築用...

論文の添え状(カバーレター)や査読プロセスとは?~金子研オンラインサロンではこれらを公開しています!~

学術論文を書いたら、論文誌に投稿することになります。金子研に関係ある論文誌はこちらです。 論文誌に投稿、といっても、実際は論文誌の編集者に論文を渡します。論文の word ファイルだけ送って、確認よろ! とするのでは味気ないですし、編集者も...

(ノート)パソコンの選び方~金子研で購入するときにチェックする7つの項目~

データ化学工学研究室 (金子研) では学生一人ひとりにノートパソコンを貸出しています (もちろん自分のノートパソコンを使っても OK !)。基本的にデータ集め・データ解析・資料の作成などはそのノートパソコンで行い、大きな計算をするときは研究...

バリデーション結果は、少数の比較には使ってよいが最適化に使ってはいけない!~外部バリデーションや(ダブル)クロスバリデーションでは何を評価しているのか?評価するときのジレンマとは?~

回帰モデルやクラス分類モデルを評価するときの話です。評価のときに、クロスバリデーションやダブルクロスバリデーションが使われることもありますが、 それぞれ何のために、何を評価しているのか?についてお話します。 そもそも、どうしてモデルを評価し...

第46回構造活性相関シンポジウムへの参加と学生の口頭発表

大阪大学の銀杏会館にて2018年12月5日(水)・6日(木)で開催された第46回構造活性相関シンポジウムに参加し、金子研の B4 江尾知也@修士に進学する期待の学生 が口頭発表してきました。発表資料は金子研オンラインサロンにて共有しています...

Anaconda のインストールから jupyter notebook の起動まで (Windows編とmacOS編)

Python でプログラミングするときの事前準備の話です。Anaconda をインストールして jupyter notebook を使いたい方はぜひご覧ください。Windows 編と macOS 編があります。ご自身の OS にあわせてどう...

練習は試合のように、試合は練習のように、みたいな研究者として使える教訓めいたもの

よくスポーツとかで、練習は試合のように行い、試合は練習のようにしよう、とかいわれます。適当に練習したら、いくら練習しても力になりませんし、本番には活かせません。なので練習ではいつも試合を想定して、あたかも試合であるような緊張感をもって行いま...

サンプルが少ないときはどうするか?・・・うーん、仕方がないのでデータ分布を仮定してたくさんサンプリングしましょう! (多変量の場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。 今回は変数が複数 (多変量) のときです。ちなみに変数がひとつ (単変量) のときはこちらです。 多変量でも、データ...
タイトルとURLをコピーしました