― 見えない診断力を持つ「新しい相棒」の登場
肌の悩みと情報の海
「なんだか、肌の調子が変かもしれない」
お風呂上がり、ふと鏡の中の自分を見て、赤みや白っぽい斑点に気づく。
痛みはないけれど、どこか気になる。
でも、病院に行くほどではないのかもしれない。
何かの前触れ?
それとも、ただの肌荒れ?
迷った末にスマホを手に取り、症状について調べてみる。
そんな経験、あなたにもありませんか?
今や私たちは、違和感を覚えたとき、まずインターネットで情報を探すことで安心しようとします。
しかし、そこで出てくる情報は玉石混交。
専門用語ばかりのページ、素人が撮った画像、矛盾する情報…。
どれを信じればよいのかわからず、かえって不安になることも少なくありません。
スマホの中の”新しい医師”
そんな中、近年大きな注目を集めているのが「画像と文章の両方を理解できるAI」、つまり”マルチモーダル大規模言語モデル(LLM)”です。
このAIたちは、単なるテキスト生成だけでなく、写真を見て内容を理解し、診断までサポートしてくれる――まるで、スマホの中にいる”新しい医師”のような存在なのです。
では、実際にこのAIたちに皮膚の病気を見せたとき、どれだけ正確に診断してくれるのでしょうか?
2025 年に公開されたある研究は、そんな素朴な疑問に本格的に取り組みました。
AI診断チームのドリームメンバーが挑んだ実験
この研究では、乾癬(かんせん)、白斑(はくはん)、丹毒(たんどく)、酒さ(しゅさ)という代表的な4つの皮膚疾患の写真 500 枚を用意し、それぞれをAIに見せて「どの病気だと思うか?」を答えさせました。
使用された画像はすべて公開データベースから取得されたもので、現実に即したさまざまな症例が含まれていました。
診断に用いたAIモデルは、OpenAI、Google、Anthropic、Meta といった世界的なテック企業が開発した7つの最先端モデル。
いわば”AI診断チームのドリームメンバー”が勢揃いした形です。
驚きの診断精度とその限界
結果として、最も高い診断精度を誇ったのは、GPT-4o という OpenAI のモデルで、67.8% の画像で正しい診断を下しました。
次点は GPT-4o Mini(63.8%)、そして Meta が提供する Llama3.2 11B(61.4%)がそれに続きました。
中でも乾癬や白斑といった”特徴が視覚的に分かりやすい病気”においては、80% を超える精度を示したケースもありました。
見た目が典型的であればあるほど、AIの診断力も正確になるという傾向が見られたのです。
一方で、丹毒のように症状があいまいで他の病気と似通っているケースでは、全モデルの平均正答率は 33.4% と低迷しました。
興味深いことに、この困難な丹毒診断において、Llama3.2 90B が 44.7% で2番目に良い成績を収めました。
中には「どのAIも間違えた」画像が55枚もあったのです。
逆に、全モデルが正解した画像も58枚ありました。
このように、AIが得意とするのは、あくまで”典型例”。
人間の医師でも迷うような微妙な症例になると、まだまだ力不足であることが明らかになりました。
プライバシーへの配慮も千差万別
さらに興味深いのは、プライバシーや倫理への配慮の仕方にもモデルによって違いがあるという点です。
たとえば、Meta の Llama3.2 90B という大型モデルは、親密な部位を写した画像に対して診断を拒否する傾向がありました。
特に乾癬や白斑の写真ではその傾向が顕著で、実に5枚に1枚の割合で「診断不可」と返答したのです。
それに対して、より軽量な Llama3.2 11B モデルはすべての画像に対して診断を試みました。
このように、モデルの設計思想や運用ポリシーが、結果の出力内容にも表れるという点は、将来的なAI活用における重要な視点になるでしょう。
研究の課題と現実の医療との違い
ただし、この研究にも課題は残ります。
使用された画像はすべて公開データベースのものであり、一部のAIが学習時に類似画像を見ていた可能性を否定できません。
また、診断の根拠となるのは画像情報のみで、年齢、性別、症状の経過など、実際の診療で医師が重視する”背景情報”は一切与えられていません。
AIは”写真だけで勝負”するしかなかったのです。
これは、まるで探偵が「証拠写真一枚だけ」で事件を解決しようとするようなもの。
やはり、実際の医療ではもっと多くの情報が必要なのです。
身近になったAI診断の可能性
それでも、この研究がもたらしたインパクトは大きなものでした。
なぜなら、無料で使え、ローカル環境でも稼働可能な中型モデルが、世界最先端のクラウド型モデルに肉薄する成果を出したからです。
これは、将来私たちが、自宅のパソコンやスマートフォンで、医師レベルに近いサポートを受けられる未来が、現実に近づいていることを意味します。
AIという”新しい相棒”との未来
結局のところ、AIは魔法の診断機でもなければ、万能の医師でもありません。
しかし、迷ったときにそっと地図を開いてくれる存在。
あるいは、暗がりの中で小さな懐中電灯を照らしてくれる相棒――それが、今のAIなのだと思います。
診察まで数日待つあいだの不安。
誰にも相談できずに検索結果の海をさまよう夜。
そんなとき、あなたのスマホの中に、静かに、でも確かに寄り添ってくれる”新しい医療のかたち”があるとしたら、少しだけ安心できるかもしれません。
AIはこれから、もっと成長し、もっと私たちの生活に溶け込んでいくでしょう。
そしてきっと、肌だけでなく、心にも寄り添える日がやってくるのです。
参考:Large language models for dermatological image interpretation – a comparative study
コメント