「この患者には、何個の皮疹がありますか?」
それは、医療現場でよくある、けれど驚くほど難しい問いです。
Mpox(サル痘)というウイルス性疾患では、皮膚にできる”病変(皮疹)”の数が、重症度を決める大事な指標になります。
でも、ただ数えるだけと思ったら大間違い。
写真一枚の中に、100 個、200 個、それ以上の小さな皮疹がびっしりと写っていることもあるのです。
ましてや、それを何十人分も繰り返す臨床研究や医療現場では—
想像してみてください。
ピンセットを持った目視の職人たちが、画面の中の点々をひとつひとつカウントしている様子を。
これを、AIが代わりにやってくれたら—どれほどの時間と労力が救われるでしょうか。
でも「数える」って、意外と難しい。
米国バンダービルト大学の研究チームは、この「数える」という行為に、本気で挑みました。
Mpox 患者18人、写真66枚。
データは、コンゴ民主共和国の奥地・熱帯雨林から持ち帰られたものです。
撮影環境はバラバラ。
光の当たり方も違えば、背景や距離、皮膚の色も一様ではありません。
しかも、皮疹は小さく、重なったり、他の部分(たとえば爪や乳首)と見間違えたりもしがち。
この”リアルで雑多”な条件こそが、AIにとっての最難関なのです。
5つのAIに「皮疹を数えてもらった」ら?
研究では、5つの異なるAIモデルを試しました:
- UNet(ベースライン):
皮疹領域をピクセル単位で塗りつぶす「セマンティックセグメンテーション」方式。 - UNet++:
より精密な処理ができる改良型。 - Mask R-CNN / YOLOv8 / E2EC:
それぞれ異なる手法で”個別の皮疹”を認識する「インスタンスセグメンテーション」。
結果はどうだったか?
最も成績が良かったのは UNet(F1スコア 0.81)。
続いて UNet++(F1スコア 0.79) という結果でした。
「数える精度」では、UNet++(LoA 幅 62.06)と Mask R-CNN(LoA 幅 62.17)がほぼ同等の優秀な成績を示しました。
面白いのは、AI同士で「チームを組ませた」場合(アンサンブルモデル)でも、単体で最優秀な UNet には勝てなかったこと。
これは、どのAIも”同じような間違い”をしてしまうからかもしれません。
小さな皮疹は、大きな課題。
エラーの多くは「小さすぎる皮疹」に集中していました。
画面上で小さな点となっている皮疹は、AIが見落としたり、逆に別のものを皮疹と誤認してしまったりします。
つまり、数え間違いは「目が悪いから」ではなく「見えているものの解釈が難しいから」起きているのです。
将来的には、もっと賢い目(たとえば円形を識別する CircleNet など)をAIに与えることで、この壁を超えるかもしれません。
この研究が私たちに残してくれること
この研究の最大の意義は「技術がどこまで医療を支えられるか」を丁寧に見つめ直した点にあります。
確かに、AIは驚くべきスピードで進化しています。
でも、完璧な道具ではありません。
学習データが偏っていれば、偏った判断をする。
皮膚の色や撮影条件によって、性能が変わってしまう。
そして何より、人間の観察力と洞察力にまだ学ぶべきことが多いのです。
けれど、そこに「希望」もあります。
今は66枚の写真だけでも、これから何千・何万の写真が集まり、AIの目がさらに磨かれていくことでしょう。
目視で数えていた研究者の目が、少しずつ、AIの力によって自由になっていく。
そのとき、私たちは「数える」ことの本当の意味を見直すことになるかもしれません。
読み終えたあなたへ
Mpox のような感染症との戦いは、最前線の医療現場だけでなく、研究室やコードの中でも日々進んでいます。
もしこの記事を通して「AIが医療の中でどんな風に活かされているか」を少しでも感じていただけたなら、嬉しく思います。
「数える」こと。
それは、ただの作業ではなく、命の重みを見つめること。
そして、その仕事を誰かが、あるいは”何か”が、正確に、丁寧に引き受けてくれる時代が、もう始まっているのです。
参考:Mpox lesion counting with semantic and instance segmentation methods
コメント