目的変数の値が0から1の間のとき、予測値も0から1の間にしたい!→ロジット変換はどうでしょう? 今回は、目的変数 Y の値が 0 から 1 の間にあり、回帰分析をするときの話です。例えば Y がモル分率などのときですね。このような Y と説明変数 X の間で回帰モデル Y=f(X) を構築して、X の値から Y の値を予測したとき、予... 2020.06.07 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
目的変数 Y における測定誤差などのばらつきを考慮したモデリング 目的変数 Y と説明変数 X との間で回帰モデル Y = f(X) を構築するとき、Y が物性・活性などの何らかの測定値である場合をはじめとして、一般的には X の値が全く同じであっても、Y は測定誤差などによってばらつきます。回帰分析では... 2020.05.31 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
どのようなときに目的変数Yではなくlog(Y)にしたほうがよいのか?~対数変換するメリットとデメリット~ 回帰分析では、目的変数 Y と説明変数 X との間でモデル Y = f(X) を構築します。このとき、Y ではなく、それを対数変換した log(Y) を用いることがあります。モデル log(Y) = f(X) を構築し、モデルに X を入力... 2020.05.31 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
成長や蓄積を実感できることを続けると、心が落ち着くかもしれません 1日1日の成長や日々蓄積していくことが確認できたり、実感できたりすると精神的に安定するかもしれません。 新型コロナウイルスの影響もあり、なかなか先が読めない中で、落ち込んだり気分的にすぐれなかったり、精神的に不安定なこともあるかもしれません... 2020.04.19 研究室雑記
変数選択・特徴量選択のときに注意すること 変数選択・特徴量選択の手法はいろいろあります。同じ値をもつサンプルの割合が大きい特徴量を削除したりとか、相関係数の絶対値が大きい特徴量の組の一つを削除したりとか、 モデルの予測精度を高めるように特徴量を選択したりとか、 乱数の特徴量のような... 2020.04.19 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室
研究室の役割を再考する 「研究室」といっても、ひとことで表現できるわけではなく、いろいろな側面があります。大きく分けると以下の 3 つになるでしょうか。 実験室・実験設備といった空間・設備の側面 研究費を用いて、研究成果を生み出す機関の側面 学生や教員が所属するコ... 2020.04.13 研究室
良くない実験結果も、データ解析・機械学習するときは大事なデータです 分子設計や材料設計において、これまでの実験データを活用して、よりよい高機能性材料を達成するための化学構造や実験条件 (実験レシピ) を設計することを考えます。このウェブサイトにいろいろと書いてあるように、たとえば化合物のもつ物性や活性 Y ... 2020.04.12 ケモインフォマティクスケモメトリックスデータ解析研究室
就活と大学院進学に関する座談会2020 今年も就活と大学院進学に関する座談会をやりました。ただ今回は状況が状況なので、Skype でつないだオンラインでの座談会です。 ちなみに昨年度の様子はこちらをご覧ください。 学生たちに質問したのは以下の内容です。 どうして就活したか? どう... 2020.04.05 研究室雑記
金子研で人を雇うときの観点 もし金子研究室で人を雇うとしたら、どのような観点で人を選ぶか、のお話をします。就活でどのような人が求められるかの参考にしていただけたらと思います。もちろん、100 の企業があれば 100 以上の考え方がありますので、その中の一つくらいにお考... 2020.03.29 研究室雑記
内挿・外挿は、モデルの適用範囲内・適用範囲外と違いますので注意が必要です 回帰分析やクラス分類によって構築された、目的変数 Y と説明変数 X との間のモデル Y = f(X) についてです。 モデルについて議論するとき、モデルはデータの外挿は予測できない、内挿しか予測できない、とか、その予測結果は内挿なの?外挿... 2020.03.29 ケモインフォマティクスケモメトリックスデータ解析プロセス制御・プロセス管理・ソフトセンサー研究室