AnthropicのAI、公開済み脆弱性の悪用コードを最短1時間で自律生成

30秒サマリー

AnthropicのAI「Claude Mythos Preview」がFirefoxの脆弱性18件中8件で実動エクスプロイトを自律生成
Windowsカーネル脆弱性21件でもソースコード非公開ながら8件で権限昇格コードを生成
パッチ公開からエクスプロイト完成まで歴史的に数週間要したが、AIにより約1時間に短縮

何が起きたか

Anthropicのフロンティア・レッドチームは2026年6月8日、大規模言語モデル（LLM）がN-day脆弱性（既公開・未パッチ状態の脆弱性）の悪用コード開発をどれだけ加速・自動化できるかを評価した研究を公開した。

FirefoxのJavaScriptエンジン「SpiderMonkey」に対する18件のセキュリティパッチを対象に、同社の最高性能モデル「Claude Mythos Preview」を評価した結果、8件で任意コード実行が可能な完全なエクスプロイトを自律生成した。最初のエクスプロイト完成は約1時間以内で、合計12時間で8種類を生成。比較対象の旧モデル「Opus 4.8」は2件、「Opus 4.6」「Sonnet 4.6」は各1件にとどまった。注目すべき点として、Mythos PreviewがあるパッチのエクスプロイトをMozillaがパッチを発行してから1時間以内に完成させた一方、そのパッチを含むFirefox 148のリリースは18日後であったと原文は述べている。

ソースコードが公開されていないWindowsカーネルに対しても評価を実施した。2026年1〜2月のカーネル脆弱性21件を対象に、逆コンパイルツールやバイナリ差分ツールのみを与えた条件下でテストを行い、8件で低権限ユーザーからSYSTEM権限への完全昇格を実現するエクスプロイトチェーンを生成した。

歴史的には、パッチ差分解析（パッチ・ディフィング）から実動エクスプロイトの開発まで数週間を要していた。原文によれば、2017年のWannaCryはMS17-010公開から59日後、2023年のCitrix Bleedは約2週間後であった。Mandiantの2020年分析では25件中16件が1か月以上を要していたと記されている。LLMはこのボトルネックとなっていたリバースエンジニアリング工程を大幅に圧縮することが示された。

原典ハイライト

研究の核心は「パブリックモデルでさえセーフガードを無効にすれば一定数のエクスプロイト生成が可能」という知見にある。Anthropicは「今日パッチ適用ギャップにある組織が直面する脅威は従来より格段に大きく、モデルが高度化するにつれリスクは増大する」と明言し、「防御側はパッチ展開速度を加速すべき」と勧告している。

出典: Anthropic Research（公式ブログ）

So What?（なぜ重要か）

これまでN-day攻撃の現実的な障壁だった「高度なリバースエンジニアリング人材の希少性」が、LLMによって急速に低下しつつある。パッチ公開からエクスプロイト完成までの時間が数週間から数時間に短縮される可能性が実証されたことで、企業が従来享受していた「パッチ適用までの猶予期間」が実質的に消滅しつつある。これはセキュリティ対応の前提を根本から変える事象であり、脆弱性管理の優先順位付けと対応速度の両方を見直す必要が生じる。

日本企業への示唆

第一に、パッチ適用の意思決定フローを見直し、重大脆弱性については「公開翌日以内の緊急適用」を標準手順として確立することが急務となる。月次のパッチ管理サイクルはリスク許容度として成立しなくなりつつある。第二に、特にソースコード非公開の商用ソフトウェア（Windowsなど）においても同等の脅威が存在することが示されたため、社内で稼働するオンプレミス環境・レガシーシステムへの影響を再評価すべきである。第三に、AIを使ったレッドチーム演習の内製化・外部委託を検討し、自社システムの「パッチギャップ」がAI攻撃者に狙われやすい状態かを定期的に検証する体制を整えることが望ましい。

背景・経緯

Anthropicはフロンティア・レッドチームとして、AIの安全性評価の一環でサイバー攻撃能力の測定を継続的に実施している。今回の研究はMozillaとの協働を含む過去のFirefox向けベンチマーク研究を発展させたものであり、ゼロデイ（未公開脆弱性）に続いてN-day（既公開・未パッチ脆弱性）の評価に対象を拡大した。Firefox側もパッチ配布周期を月次から約週次へと短縮するなど、防御側の迅速化の取り組みが進んでいる文脈でこの研究が行われている。

AI News JAPAN