迷いを減らす「道しるべ」としての機械学習
糖尿病の治療と聞くと「血糖値を下げる薬を使う」というシンプルな話に見えるかもしれません。
けれど実際の診療では、薬が増えたぶんだけ、迷いも増えています。
どちらも心臓や腎臓を守る力が期待される薬なのに、その人にはどちらがより合っているのか。
そんな、医師にとっても患者にとっても切実な問いに、機械学習で答えようとした論文が2026年に公表されました。
なお、この論文は現時点で「Article in Press」の未編集版として公開されており、最終版で表現などが修正される可能性があります。
今回の主役は、2型糖尿病治療でよく話題にのぼる2つの薬です。
SGLT-2阻害薬とGLP-1受容体作動薬。
どちらも有力な選択肢ですが「この人にはこちら」と背中を押してくれる明快な指針は、これまで十分ではありませんでした。
そこで研究チームは、患者ごとの特徴をもとに、どちらの薬がより血糖コントロールに向きそうかを予測する「TiP DecScore」という仕組みを作ったのです。
この研究のおもしろさは、AIを魔法の箱として扱っていないところにあります。
使われたのは、年齢、糖尿病の罹病期間、BMI、HbA1c、空腹時血糖、空腹時Cペプチド、血圧、ALT、クレアチニン、LDLコレステロールなど、日常診療で比較的手に入りやすい15項目です。 特別な未来の検査ではなく、いま病院にある情報から、薬選びの地図を描こうとしたわけです。
まるで、旅に出る前に最新の道路情報を重ねて、どの道が自分にとって走りやすいかを見極めるような発想です。
研究の規模も小さくありません。
モデル作成には中国の大規模データベースから24,322人、独立した検証には1,459人のデータが使われました。
しかも、6か月後と12か月後という、少し先ともう少し先の両方を見ています。
短距離走だけでなく、中距離走の走り方まで比べたような設計です。
評価の中心に置かれたのは、HbA1cが7%未満に届くかどうか、そしてHbA1cそのものがどこまで下がるかでした。
結果は、なかなか興味深いものでした。
まずモデルの予測性能は、検証データでAUROC 0.71から0.78と報告され、実用を考えるうえで一定の力を示しました。
さらに推奨の傾向としては、6か月時点でも12か月時点でも、SGLT-2阻害薬よりGLP-1受容体作動薬が選ばれやすい結果になっています。
6か月ではGLP-1受容体作動薬が57.6%、SGLT-2阻害薬が24.2%。 12か月でもそれぞれ57.9%と28.6%でした。
すべての人に一律で同じ薬、ではなく、かなりはっきりと傾きが出たのです。
ただし、この研究の本当の見どころは「どちらが人気か」ではありません。
AIの推奨と実際の治療が一致していた人たちは、一致していなかった人たちよりもHbA1c目標を達成しやすかった、という点です。
6か月後では一致群57.4%、不一致群49.4%。 12か月後でも一致群55.1%、不一致群47.4%でした。
数字だけ見ると数ポイントの差に見えるかもしれませんが、日々の食事や運動、通院の積み重ねの先にある「届くか、届かないか」を左右する差だと考えると、その重みは決して小さくありません。
さらに印象的なのは、差がより大きく表れた人たちがいたことです。
12か月後では、55歳未満の比較的若い患者で、一致群64.1%に対し不一致群46.2%。
男性でも、一致群58.6%に対し不一致群45.6%でした。
研究チームは、こうした違いについて、年齢や併存症、性差に関わる要因が関係している可能性に触れつつ、特に高齢者や女性への適用では、最終判断に追加の配慮が必要だと述べています。
つまりAIは便利でも、最後の一歩まで自動では決めない。
その慎重さが、この研究の誠実さでもあります。
では、どんな人にどんな傾向が見えたのでしょうか。
6か月時点では、糖尿病の期間が比較的短く、空腹時Cペプチド、ALT、BMI、LDLコレステロールが高めの人で、GLP-1受容体作動薬が優先されやすい傾向が示されました。
12か月時点になると、より重要だったのは、治療前のHbA1cとBMIです。
HbA1cが高く、BMIも高い人ほど、GLP-1受容体作動薬が推されやすくなっていました。
逆にSGLT-2阻害薬では、クレアチニンがより重要な手がかりになっていたと報告されています。
ここをやさしく言い換えるなら、このAIは「糖尿病」という一枚の大きなラベルだけを見ていない、ということです。
同じ2型糖尿病でも、インスリン分泌の余力がどのくらいあるか、体重や肝機能の背景はどうか、血糖の高さがどれほど強いかで、向く薬の表情が少しずつ変わる。
その違いを、診察室の空気ではなく、データの重なりとして見せてくれるのです。
いわば、同じ雨の日でも、傘が必要な人とレインコートが向く人を分けて考えるようなものです。
濡れないため、という目的は同じでも、最適な備え方は一人ひとり違います。
しかもこのTiP DecScoreは、何でもかんでも断定する仕組みではありません。
スコア差が大きければ一方の薬を推し、差が小さい中間域では「どちらも似た効果かもしれないので、最終判断は臨床医へ」と委ねます。
これはとても大切な設計です。
AIが主役なのではなく、AIが診療の会話を少し深くする。 研究全体を読むと、そんな立ち位置がはっきり見えてきます。
もちろん、明るい話ばかりではありません。
著者たち自身も限界を率直に書いています。
この研究が見ているのは主にHbA1cであり、糖尿病合併症の長期リスクや、持続血糖測定のような細かな血糖変動までは扱っていません。
また、追跡データがある患者だけを対象にしているため、選択バイアスの可能性がありますし、検証用データは独立しているとはいえ1,459人と、さらに大規模な外部検証が望まれる段階です。
若年層や高齢層にどこまで一般化できるかも、今後の課題として挙げられています。
それでも、この論文が放つ光は十分にあります。
2型糖尿病の個別化医療という言葉は、これまで少し遠い未来のものに感じられてきました。
けれどこの研究は、それを「診察室で使えるかもしれない道具」へと一歩近づけました。
特別なSFの話ではなく、いつもの採血データや診療記録から、薬選びの迷いを少し減らす。
そこに機械学習の価値があります。
糖尿病治療は、正解がひとつに決まる世界ではありません。
だからこそ、患者ごとの違いを見落とさない視点が大切になります。
この論文を読んでいると、AIとは人間の判断を奪うものではなく、見えにくかった輪郭をそっと浮かび上がらせる灯りなのだと感じます。
薬を選ぶという行為は、ただ数値を下げるためだけではありません。
その人の暮らしを、これから先も続いていく日常を、少しでも楽にするための選択です。
もし医療の未来があるとすれば、それは冷たい自動化ではなく、こうした「一人ひとりを、もう少し丁寧に見るための技術」の先にあるのかもしれません。
参考:A machine learning model for optimizing treatment of patients with poorly controlled type 2 diabetes
コメント