三菱電機と金子研における共同研究の成果の論文が Journal of Chemometrics に掲載されましたので、ご紹介します。タイトルは
です。これは共同研究として三菱電機の方々と一緒に研究した成果であり、2023 年度に当時4年生の高見優太さんが取り組んだ研究の成果です。
本論文は、中赤外分光法の一種である全反射測定を利用した光熱偏向分光法(TIR-PTD)を用いた、非侵襲的な血糖値測定モデルの構築とその精度向上に関する研究成果を報告しています。糖尿病管理において日常的な血糖測定は重要ですが、従来の採血や皮下センサーを用いる方法は侵襲的であるため、本研究では光を用いた負担の少ない測定法の確立を目指しました。
今回は、7名の健常者から得られた計404サンプルのスペクトルデータを使用しました。血糖値の推定精度を向上させるための重要なアプローチとして、以下の2つのデータ処理手法を導入しています。
- POSG(Pretreatment with Optimized Savitzky–Golay): ノイズを除去し、スペクトルの特徴を強調するための最適な平滑化・微分による前処理法
- Boruta法: ランダムフォレストに基づき、血糖値と関連性の高い波数(説明変数)を選択する手法
モデルの評価は、データをランダムに分割するダブルクロスバリデーション DCV (simple)と、被験者ごとに分割して未知の被験者を推定するダブルクロスバリデーション DCV (subject) の2種類のダブルクロスバリデーションにより行われました。検証の結果、POSGによる前処理とBorutaによる変数選択を組み合わせることで、両方の検証手法において決定係数(r2)や根二乗平均誤差(RMSE)などの指標が改善されることが確認されました。化学的な解釈として、変調周波数30 Hzのデータはグルコースやその代謝物の情報を、110 Hzのデータは皮膚表面(角層)の情報を反映していると考えられています。
DCV (subject) の結果からは、被験者間の個人差が推定精度に大きく影響することが明らかになりました。そこで、さらなる精度向上のために「モデル補正」という手法が検証されました。これは、推定対象となる被験者の「測定初日」のデータ(侵襲測定値とスペクトル)を学習データに追加し、2日目以降の血糖値を推定するものです。結果として、他人のデータのみで学習する場合や本人の初日データのみで学習する場合と比較して、モデル補正を行ったモデルは最も高い精度を示しました。
本研究により、提案手法が非侵襲血糖値測定の精度向上に有効であることが示されましたが、現時点では国際的な精度基準であるISO 15197:2003の要件(95%以上のデータが許容誤差内に収まること)を完全に満たすには至っていません。今後の課題として、データセットの拡充、個人差の影響を受けにくい特徴量の探索が挙げられます。
興味のある方は、ぜひ論文をご覧いただければと思います。
以上です。
質問やコメントなどありましたら、X, facebook, メールなどでご連絡いただけるとうれしいです。
