Anthropic、超危険AI「Claude Mythos」を限定的公開へ
Anthropicが高度な脆弱性発見AI「Claude Mythos」をオーストラリア政府など限られた組織に提供開始。防御側に有利とされる一方、誤検出や悪用リスクも指摘される。
Anthropicが、一般公開には危険すぎるとされていた高度なAIモデル「Claude Mythos」のアクセス範囲を拡大した。The Conversationの報道によると、このモデルはソフトウェアの脆弱性を自動発見するための特化型AIであり、Project Glasswingと呼ばれる枠組みの下で、オーストラリア政府を含む15カ国・約150の組織に提供される。サイバーセキュリティの領域で「防御側に決定的な優位をもたらす」と期待される一方、その強力さゆえに悪用リスクも同時に議論されている。
危険すぎて公開できなかったAI
Claude Mythosは、従来の汎用大規模言語モデルとは一線を画す。コードベースを解析し、人間では見逃しがちな重大な脆弱性をピンポイントで特定するために設計された。通常のAIモデルのようにチャットや文章生成を目的とせず、バグやセキュリティホールの検出に特化している点が特徴だ。
Anthropicはこのモデルを「防御側に最終的な勝利をもたらす可能性がある」と評価しているが、同時にその能力が攻撃者に渡った場合の被害を考慮し、厳格なアクセス制御を課してきた。今回の拡大は、限定的とはいえ、政府機関や大手企業が最先端のAI防御力を手にする転機と言える。
発見した脆弱性の実績と精度
初期テストでは、Claude Mythosは23,000件もの脆弱性をフラグ付けした。そのうち6,200件が高リスクと推定され、さらに人間の専門家による検証で、高リスクと判定されたもののうち約3分の2が実際に深刻な脆弱性であることが確認された。
この精度は、既存のツールと比較してどの程度優れているのか。元記事では具体的な数値比較は示されていないものの、「防御側が初めて攻撃者に対して決定的な優位に立てる」との評価は、これまでにない性能を示唆している。特に、ゼロデイ脆弱性の発見率向上は、企業や政府のセキュリティ体制を大きく変える可能性がある。
誤検出と過負荷のリスク
しかし、Claude Mythosの導入には課題も多い。23,000件のフラグのうち、実際の高リスクは約4,000件程度(検証済み)にとどまる。残りの大半は誤検出または低リスクであり、セキュリティチームに膨大なアラート処理の負荷を強いることになる。
セキュリティ運用の現場では、アラート疲れが既に深刻な問題となっている。自動ツールがさらに多くのノイズを生み出せば、本当に対応すべき重要案件を見逃すリスクが高まる。組織はMythosを導入するにあたり、アラートの優先順位付けや人的リソースの再配分を同時に進める必要がある。
AI自体を狙った攻撃にも警戒
さらに、Claude Mythosが発見する脆弱性だけでなく、AIシステムそのものが攻撃対象になるリスクも無視できない。元記事は、MetaのAIチャットボットが悪用され、バラク・オバマ元大統領を含む高級アカウントが乗っ取られた事例を挙げている。プロンプトインジェクションやモデル操作といった手法によって、AIが本来意図しない動作を強制されるケースが増えている。
Claude Mythosのような高価値なAIシステムは、攻撃者にとって格好の標的となる。アクセス権限を持つ組織内の内部脅威や、サプライチェーン経由での侵害も想定しなければならない。
オーストラリア政府の参加と今後の展開
オーストラリア信号局(ASD)は、Project Glasswingへの参加を歓迎する姿勢を示している。OptusやMedibank Privateなど、近年相次ぐ大規模サイバーインシデントに見舞われてきた同国にとって、Mythosは待望の防御手段である。ただし、具体的な活用方法や評価基準については、政府は詳細を明らかにしていない。
この限定的公開が、今後より広範な展開につながるのか、あるいはリスク評価次第で閉じられるのかは不透明だ。Anthropicは「危険すぎるAI」の社会的受容と管理のモデルケースとして、この取り組みを位置づけている可能性がある。
編集部の見解
短期的影響
今後3〜6ヶ月の間に、Project Glasswing参加組織ではMythosによる脆弱性スキャンが本格稼働し、ソフトウェアサプライチェーンのセキュリティが一段階向上すると予想する。一方で、誤検出率の高さから、セキュリティ人材の不足が一層顕在化するだろう。日本政府や国内大手企業も同様の取り組みを検討し始める可能性がある。特に、金融や重要インフラ分野では、初期導入の模索が始まるかもしれない。
長期的視点
1〜3年のスパンでは、「脆弱性発見AI」が一般市販品として流通し、セキュリティ診断のコモディティ化が進むと見る。攻撃側も同様の技術を手に入れるため、防御側の優位は永続しない。むしろ、AI同士の攻防という新たな領域が生まれ、セキュリティ業界の競争軸が変化する。また、こうした高度AIに対する規制や輸出管理が国際的に議論される契機となるだろう。日本としても、技術的なキャッチアップと同時に、法的なガバナンス枠組みの整備を急ぐ必要がある。
編集部からの問い
Claude Mythosのような「二重用途」AIを、誰がどのような条件で利用できるのかという線引きは極めて難しい。読者の皆さんには、自社のセキュリティ戦略において、外部から提供される先端AIをどこまで信頼し、どの程度依存するのか、という問いを考えていただきたい。また、こうしたツールの導入によって、既存のセキュリティエンジニアの役割はどう変化するとお考えか。ぜひ意見をお聞かせいただきたい。
参考
よくある質問
- Claude Mythosは一般ユーザーも利用できるのか
- 現時点では利用できない。Project Glasswingの参加組織(15カ国約150組織)に限定されており、一般公開の予定は示されていない。Anthropicは危険性を理由に厳格なアクセス制御を行っている。
- Claude Mythosと通常のAIモデル(Claude 3 Opusなど)の違いは何か
- 通常のClaudeモデルは汎用的な会話や文章生成が目的だが、Mythosはソフトウェアの脆弱性発見に特化して設計されている。バグやセキュリティホールを自動的に検出することに主眼を置き、他の用途には使えないよう制限されている。
- 日本の組織もProject Glasswingに参加できるのか
- 現時点で参加国は15カ国程度に限られており、日本が含まれているかは明らかにされていない。Anthropicや各国政府の判断次第であり、今後の拡大可能性については公式発表を待つ必要がある。
コメント