相澤研と金子研における共同研究の成果の論文が Analytical Science Advances に掲載されましたので、ご紹介します。タイトルは
です。これは共同研究として明治大学の相澤先生の研究室の方々と一緒に研究した成果であり、修士卒の酒井優太さんが四年生のときに取り組んだ研究の成果です。
高齢化が進んでおり、高齢者ほど骨系統疾患を患いやすいことから、骨粗鬆症をはじめとした骨系統疾患患者の増加が懸念されています。骨欠損の治療法の多くは自家移植、同種移植に基づいていますが、供給源が限られる点や免疫反応の危険性などの欠点があることから、現在は人工骨に注目が集まっています。
人工骨にとって重要である要素の一つに骨形成率がありますが、骨形成率は実験動物に埋入し、数週間から数か月経過しないと計測することができません。必要以上の動物犠牲は倫理的観点からも避けるべきであり、相澤研と金子研の共同研究でも、実験せずに骨形成率を予測するモデルの開発を進めてきました。



これらの研究で使用されたデータセットでは、同じ人工骨を同種の動物の複数の異なる個体に埋め込んで骨形成率を測定したため、複数の骨形成率の値が得られました。複数測定された骨形成率は全く同じ人工骨材料であるにもかかわらず、動物の個体差などのため、結果にはばらつきがあります。
これまでは骨形成率の測定値の平均値を代表値として使用したため、トレーニングデータのばらつきを考慮したモデルを構築できず、予測値からどの程度骨形成率がばらつくかが予測できませんでした。そこで本研究では、実験結果のばらつきを考慮した人工骨の骨形成率を予測し、評価することを目的としました。まず、実験結果のばらつきの表現を行うために、元のデータセットから同じ人工骨の複数の骨形成率のサンプルの重複がないようにかつ、すべての人工骨材料をランダムに抽出したデータセットをサブデータセットとして、100個準備します。そしてサブデータセットごとに個別にモデルを構築します。予測する際は、あるアンプルに対して 100 個の予測値が得られるため、予測値のばらつきによってサンプルごとの骨形成率のばらつきを表現できます。
サンプルごとの骨形成率のばらつきを考慮したモデルの予測精度の評価について、これまでの r2 や MAE などは骨形成率の予測値の平均値を評価できますが、予測値の標準偏差といったばらつきを評価できません。そこで、得られた推定値のばらつきと実測値のばらつきを比較、評価するための新たな指標として、Jensen-Shannon (JS) ダイバージェンスを用いた指標を提案しました。JS ダイバージェンスは確率分布間の類似度を数値化する指標です。今回は骨形成率のばらつきが正規分布に従うと仮定し、実測値、予測値それぞれの平均値と標準偏差から JS ダイバージェンスを計算しました。
使用する説明変数の種類と組み合わせをいくつか検討し、構築したモデルにより得られた結果と JS ダイバージェンスをその他の指標と比較することで、提案した指標である JS ダイバージェンスの妥当性を評価しました。また、今回提案した手法を使用すれば、人工骨に限らず実験結果のばらつきを表現できる機械学習モデルを構築・評価でき、実験の再現性等の評価にもつながります。
興味のある方は、ぜひ論文をご覧いただければと思います。どうぞよろしくお願いいたします。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。