バリデーション結果は、少数の比較には使ってよいが最適化に使ってはいけない!~外部バリデーションや(ダブル)クロスバリデーションでは何を評価しているのか?評価するときのジレンマとは?~

回帰モデルやクラス分類モデルを評価するときの話です。評価のときに、クロスバリデーションやダブルクロスバリデーションが使われることもありますが、それぞれ何のために、何を評価しているのか?についてお話します。そもそも、どうしてモデルを評価したい...

第46回構造活性相関シンポジウムへの参加と学生の口頭発表

大阪大学の銀杏会館にて2018年12月5日(水)・6日(木)で開催された第46回構造活性相関シンポジウムに参加し、金子研の B4 江尾知也@修士に進学する期待の学生 が口頭発表してきました。発表資料は金子研オンラインサロンにて共有しています...

Anaconda のインストールから jupyter notebook の起動まで (Windows編とmacOS編)

Python でプログラミングするときの事前準備の話です。Anaconda をインストールして jupyter notebook を使いたい方はぜひご覧ください。Windows 編と macOS 編があります。ご自身の OS にあわせてどう...

練習は試合のように、試合は練習のように、みたいな研究者として使える教訓めいたもの

よくスポーツとかで、練習は試合のように行い、試合は練習のようにしよう、とかいわれます。適当に練習したら、いくら練習しても力になりませんし、本番には活かせません。なので練習ではいつも試合を想定して、あたかも試合であるような緊張感をもって行いま...

サンプルが少ないときはどうするか?・・・うーん、仕方がないのでデータ分布を仮定してたくさんサンプリングしましょう! (多変量の場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。今回は変数が複数 (多変量) のときです。ちなみに変数がひとつ (単変量) のときはこちらです。多変量でも、データ数が...

サンプルが少ないときはどうするか?・・・うーん、仕方がないので幅で考えましょう! (一変数・単変量で正規分布に従う場合)

あまりたくさんの実験ができないとき、あまり多くの分析ができないとき、あまり繰り返しシミュレーションできないときのお話です。データ数が少ないため、偶然の要素を排除できません。今回は一変数のときに、"偶然の要素を排除できない" とはどういうこと...

金子研の学生が圧倒的に成長する3つの理由

データ化学工学研究室 (金子研究室) では、学生の成長を最優先に考えています。(その結果、研究成果にもつながるのは上に書いたとおりです。)いろいろな視点で学生のことを見ていますが、実際に成長しています。ここではその理由について考えます。まず...

いろいろな学生の受け皿になる

タイトルの “いろいろ” とは、(広い意味での) 研究に割く時間という意味でのいろいろです。いろいろな学生がいます。研究一本にオールインして頑張るぜ!といった学生から、バイトも、課外活動も、趣味も、恋愛も、その一つとして研究も、といったバラ...

テストデータ・バリデーションデータ(モデル検証用データ)におけるモデルの精度が低いときのポジティブな側面

回帰分析やクラス分類の話です。データセットがあるとき、まずモデル構築用データ (トレーニングデータ) とモデル検証用データ (テストデータ) に分けます。次にトレーニングデータで回帰モデル・クラス分類モデルを構築します。そして、モデル構築に...

大学教員のお仕事内容をチラ見してみよう!

タイトルの通りで、わたし 金子を例にして、大学教員が普段どんなお仕事をしているのか、書ける範囲で公開します。たまに、「学生が夏休みのときは大学教員も休みなんですよね、いいですね~」 みたいに誤解されている方もいらっしゃいます。ただ実際は、学...
タイトルとURLをコピーしました