AI

Fable 5規制18日間で解除、Anthropicが安全対策を説明

AnthropicがClaude Fable 5の世界規模での提供を再開した。米国商務省が輸出規制を撤廃したことを受け、18日間の空白を経ての復帰となる。規制の原因となった脆弱性特定手法に対する単一のセーフティフィルターが実装された。

7分で読める SINGULISM 編集チームが確認・編集

Fable 5規制18日間で解除、Anthropicが安全対策を説明
Photo by Zulfugar Karimov on Unsplash

Anthropicは現地時間6月30日、同社の大規模言語モデル「Claude Fable 5」のグローバルアクセスを再開した。米国商務省が6月12日に課した輸出規制を翌日に撤廃したことを受けた判断だ。同社の公式ブログで明らかにされた。

規制の発動から解除まで、18日間の空白期間が生じた。この事態を収束させたのは、Amazonの研究者が発見した特定のプロンプト技術を阻止するために調整された、単一のセーフティフィルターであった。商務省傘下のAI基準・イノベーションセンター(CAISI)が安全対策を審査した上で、規制が解除されたという。

事態の発端と経緯

米国商務省は6月12日、Fable 5およびそのベースとなる「Mythos 5」に対して輸出規制を発動した。対象となったのは、米国籍以外の外国籍の人物による利用で、Anthropicの非米国籍従業員も含まれていた。国籍を特定できない仕組みであることから、Anthropicは両モデルを全世界で停止する判断を下した。

問題の発端は、Amazonの研究者による報告だった。研究者らは特定のプロンプトを用いて、Fable 5にソフトウェアの脆弱性を特定させ、さらにその脆弱性を悪用するコードを記述させる手法を見つけ出していた。

実装された安全対策

Anthropicは新たな分類器を訓練し、Amazon研究者が報告した特定のプロンプト技術を99%以上のケースでブロックする。この分類器が検知したリクエストは、旧バージョンのOpus 4.8にルーティングされる。同社はこの変更により、正当なコーディングやデバッグのリクエストも誤って捕捉される副作用があると認めている。

重要な点として、この分類器は報告されたプロンプトそのものを標的としており、モデルの能力自体を削減するものではない。Fable 5は依然としてAmazonの報告書に記載された脆弱性を識別できる。分類器が検知したリクエストをルーティングする方式であり、モデルから能力を除去するわけではない。

しかし、検出ベースの安全対策は、そもそも禁止措置の引き金となった攻撃を突破された手法でもある。既知の技術にのみ調整された分類器では、まだ発見されていない技術に対しては無力だ。Anthropicは、どのモデルも完全に脱獄耐性を持つことはできず、今後さらに多くの脱獄手法が表面化することを認めている。

Fable 5の現状

Fable 5は現在、Claude.ai、Claude Platform、Claude Code、Claude Coworkで利用可能となっている。AWS、Google Cloud、Microsoft Foundryでの提供も順次再開される見通しだ。

Anthropicが政府およびAmazonとの協力で実施した調査では、Opus 4.8、OpenAIのGPT-5.5、中国のKimi K2.7も同じ脆弱性を識別できたことが判明している。テストされたすべてのモデル(Haiku 4.5、Sonnet 4.6、複数のOpusバージョンを含む)が、単一のエクスプロイトの実演を再現可能だった。この結果は、Mythosクラスのサイバー能力が過大評価されていたという主張を裏付けるものとなっている。

Fable 5の復帰は、同モデルが不在の間に中国のラボZ.aiのGLM-5.2がデフォルトで保持していたベンチマークの首位を奪還することになる。Fable 5は、マルチウィークタスクテスト「AA-Briefcase」において、アクセス可能な最高スコアを再び獲得した。

一方、より少ないガードレールで運用され、Project Glasswingパートナーに限定されているMythos 5は、6月26日に一部の米国組織に対して復帰している。

今後の脆弱性報告体制

Anthropicは同時に、新たなFable 5の脱獄手法を研究者が報告するためのHackerOneプログラムを開設した。また、指定された政府パートナーに対して、継続的な監査のためのアクセスを提供することを約束している。

本件は、AIモデルの安全性と国際的な規制の複雑な関係を浮き彫りにした。単一のプロンプト技術が18日間にわたるグローバルなサービス停止を引き起こした事実は、AIガバナンスの難しさを示している。

編集部の見解

短期的には、今回の規制解除によりFable 5が再びグローバル市場で競争力を取り戻したことは確かだ。特に中国のGLM-5.2がベンチマークで首位を獲得していた状況を考えれば、Anthropicにとっては重要局面での復帰と言える。しかし、単一の分類器による対策は、今後新たな脱獄手法が発見されるたびに同様の事態が繰り返されるリスクを内包しており、根本的な解決には至っていない。 長期的に見ると、今回の輸出規制の発動から解除までのプロセスは、AI安全性を巡る米国政府と企業の関係に新たな枠組みをもたらす可能性がある。CAISIによる安全対策の事前審査というプロセスが確立されたことで、今後の規制判断において同様の手続きが標準化されるかもしれない。一方で、このような国家間の規制がAIモデルのグローバルな可用性に直接影響を与える構図は、技術の民主化という観点からは懸念材料だ。 編集部としては、検出ベースの安全対策の限界が露呈した今回の事態を受けて、業界全体がモデル自体の安全性を高めるアーキテクチャレベルの対策に注力すべきではないかと考える。

参考

よくある質問

Claude Fable 5は現在正常に利用できるのか
はい。2026年6月30日より、Claude.ai、Claude Platform、Claude Code、Claude Coworkを通じてグローバルに利用可能となっている。AWS、Google Cloud、Microsoft Foundryでの提供も順次再開される。
なぜ単一の安全フィルターで規制が解除されたのか
規制の原因となった脆弱性特定手法は、Amazon研究者が報告した特定のプロンプト技術に限定されていた。Anthropicはその手法のみを99%以上の精度でブロックする分類器を訓練・実装し、米国商務省のCAISIがこれを審査したことで規制撤廃に至った。
他のAIモデルも同じ脆弱性を特定できたのか
はい。Anthropicの調査では、Opus 4.8、OpenAIのGPT-5.5、中国のKimi K2.7を含むテストされたすべてのモデルが、報告された脆弱性を識別し、エクスプロイトコードを生成できた。この結果は、Mythosクラスのサイバー能力が過大評価されていた可能性を示している。 ## 参考 - [Anthropic restores Claude Fable 5 as US lifts export controls — single filter now blocks prompt that could identify software vulnerabilities and write code to exploit them](https://www.tomshardware.com/tech-industry/artificial-intelligence/anthropic-restores-claude-fable-5-as-us-lifts-export-controls) — Tom's Hardware 2026-07-01公開 - Anthropic公式ブログ(関連情報) - [Linux 7.2-rc1リリース、AMDGPU HDMI 2.1 FRLやCache Aware Schedulingを統合](https://singulism.com/ja/linux-7-2-rc1-released) — システムレベルの安全性とパフォーマンス最適化に関連
出典: Tom's Hardware

コメント

← トップへ戻る