データ解析や機械学習の相談を受けるとき、背景やデータの内容を聞くだけで、上手くいきそうとか、上手くいかなさそうとか、感覚的にわかることがあります。実際にデータを見るとその確度が高まりますが、データを見なくても、ある程度わかったりします。
たとえば、双子の人を見分けるとき、最初はその人たちの顔や体の特徴を判断材料にして、意識的に見分けますが、見慣れてくると、意識的に見分けようとしなくても、無意識に双子を見分けられる、そんな感じかもしれません。
データ解析・機械学習が上手くいくときの話や、上手く生かせる方法や、どのようにサンプルを数値化・記述子化するべきとか、どの手法を使うべきとか、言語化できるものはこのブログでたびたび紹介していますし、
これから言語化できるところを多くしようとも思っています。一方で、すべて言語化できるわけではなさそう、とも考えています。また、言語化するべきではないこともある、と思っています。
たとえば、コンビニでアルコール飲料を買うとき、レジにおいて画面の 「わたしは二十歳以上です」 のようなところをタップする必要があります。きっとルール的には、買う人が押さなければならないことになっていると思いますので、これをタップしなければ (できなければ) 見た目がお年寄りであろうと、アルコール飲料は購入できません。もちろん、レジ打ちの方から毎回、二十歳以上ですか、と聞かれることと比べて、機械的にタップすれば済むことの方がストレスは減ります。ただ、このシステム・ルールを導入したことによって、問題がすべて解決されるわけではありませんし、システム・ルールの導入前であれば問題なかったことが問題になることもあります。0 か 100 か、で片付けられる問題ではなく、システムやルールを積み重ねることで、すべて解決するような問題でもありません。頑張れば頑張るほどゴールに近づくようなものではないわけです。
ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスでも、同じようなことを感じています。言語化することですべて解決するとも限らず、新たな問題、もしくは昔の問題が出てくることもあります。
ひとつ言語化すると、未知の (言語化できない) 内容が増えるような感じもあります。なので、いつまでたってもゴールにはたどり着かないという感覚はあります。むしろ、ゴールが遠くなることで、相対的にスタートラインに近づいていくような感じもしています。
それが研究の面白いところでもあったりするので、研究が続けられる、といったところかもしれません。
以上です。
質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。