ある日、あなたのスマートフォンが「不審なログインを検出しました」と警告を発したとします。
多くの人がパスワードを変え、セキュリティを見直すでしょう。
しかし、もしその裏側で、侵入を試みていたのがAI(人工知能)だったとしたら?
SFの話のように聞こえるかもしれませんが、それはもう現実になりつつあります。
人間 vs. AI: リアルな企業環境での”模擬戦争”
スタンフォード大学とカーネギーメロン大学の研究者たちは、世界で初めて、AIエージェントと人間のサイバーセキュリティ専門家が本物の大学ネットワークでペネトレーションテスト(侵入テスト)を行う実験を実施しました。
舞台は、約8,000台ものホストが接続された実際の大学ネットワーク。
普段から学生や研究者が使用している、まさに「現場」です。
このリアルな環境で、10人のプロフェッショナルと複数のAIが、脆弱性を探し出すレースを繰り広げました。
ARTEMISというAIの登場: 複数の”仮想ハッカー”を束ねる司令塔
今回の主役は、研究チームが新たに開発したAIエージェントARTEMIS(アルテミス)。
これは単なる「AIがコードを読むツール」ではありません。
ARTEMISは、まるでハッカーチームの司令官のような役割を果たし、次々と仮想の”部下(サブエージェント)”を派遣。
ネットワークをスキャンし、弱点を探し、脆弱性を見つけたら、証拠を集めて報告します。
このアプローチにより、ARTEMISは複数の作業を同時に進めることが可能となり、まさに”多方面攻撃”を実現しました。
結果は驚き: AIが人間の9人を上回る性能を発揮
結果は衝撃的でした。
ARTEMISは全体で2位にランクイン。
10人中9人の人間よりも多くの有効な脆弱性を発見し、成功率は82%にも達しました。
しかも驚くべきことに、その費用は1時間あたりわずか18ドル(約2,600円)。
人間のプロが1時間あたり約60ドルであることを考えると、コストパフォーマンスの面でもAIが圧勝です。
でも、AIは完璧じゃない: 弱点もしっかり見えた
とはいえ、AIにも限界はあります。
たとえば、TinyPilotというGUI(画面操作)を使うシステムにおいて、ほとんどの人間が見つけた重要な脆弱性を、AIは見逃しました。
なぜなら、ARTEMISはGUIの操作が苦手で、ログイン画面の”見た目”の挙動を正確に理解できなかったからです。
また、AIは「誤検出」も多め。
HTTPステータスが「200 OK」だっただけで、ログイン成功と判断してしまうなど、文脈の理解が浅いことが原因のミスも目立ちました。
それでもAIの可能性は大きい
この実験を通してわかったのは、AIが人間に代わってセキュリティの最前線に立てるという現実だけではありません。
重要なのは、人間とAIが「得意なこと」を補い合えば、より強力な防御が可能になるということです。
たとえば、AIは疲れ知らずで繰り返し作業や広範囲のスキャンに優れています。
一方、人間は、直感やGUIの解釈、戦略的判断で一枚上手です。
これらを組み合わせれば、サイバー攻撃に対する“最強の守り”ができるかもしれません。
読後のひとこと: 未来のセキュリティは「共闘」が鍵
今回の実験が教えてくれたのは、AIが単なる道具ではなく、サイバーセキュリティの”仲間”になりうる存在であるということです。
もちろん、まだ完璧ではありません。
でも、人間もまたミスをします。
だからこそ、人とAIが互いの強みを理解し、一緒に戦っていく未来が、私たちのセキュリティをより強固にしてくれるのではないでしょうか。
あなたが次に「不審なアクセスを検出しました」と表示を見たとき、その背後に”人”がいるのか”AI”がいるのか。
そして、それに立ち向かっているのはどちらなのか。
少しだけ想像してみてください。
参考:Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing
コメント