AI11分で読める

Anthropic新モデル「Claude Mythos」がデータ漏洩で発覚——サイバー能力で他社を圧倒

約3,000件の未公開アセットが流出——Anthropicのコンテンツ管理システム(CMS)の設定ミスにより、同社が開発中の次世代AIモデル「Claude Mythos」(内部コード名:Capybara)の存在が明らかになった。漏洩したブログ草稿によると、このモデルは「コーディング・推論・サイバーセキュリティの各テストで劇的に高いスコア」を記録し、Claude Opus 4.6をはるかに超える性能を持つという。Fortune誌が2026年3月26日に独占報道し、Anthropic側もモデルの存在を認めた。

AI業界では「ステップチェンジ(段階的飛躍)」という表現が使われることは稀だ。にもかかわらず、Anthropic自身がMythosをそう形容している事実は、このモデルが単なるアップデートではなく、能力の次元が異なることを示唆している。本記事では、漏洩した情報をもとに、Claude Mythosの性能・リスク・そして日本のユーザーへの影響を徹底解説する。

漏洩の経緯——CMS設定ミスという皮肉

事の発端は、AnthropicのCMSにおける設定エラーだった。約3,000件の未公開アセット(ブログ草稿、プレスリリース下書きなど)がパブリックアクセス可能なデータキャッシュに格納されていたのだ。Fortune誌の記者がこれを発見し、Anthropicに通知。同社は直ちにアクセスを遮断したが、時すでに遅しだった。

皮肉なのは、サイバーセキュリティに圧倒的な強みを持つとされるモデルの存在が、自社のセキュリティ設定ミスで漏洩したという点だ。AIの安全性(AI Safety)を最重要ミッションに掲げるAnthropicにとって、これは看過できない失態といえる。

Claude Mythosとは何か——「Capybara」ティアの正体

以下の図は、Anthropicのモデルティア構成におけるMythos(Capybara)の位置づけを示しています。

Anthropic Claudeモデルティア構成。Haiku、Sonnet、Opus 4.6の上位にCapybara(Mythos)が位置し、データ漏洩で存在が発覚

Anthropicは現在、Claude モデルを3つのティア(Haiku・Sonnet・Opus)で展開している。Mythosは、これらの上位に位置する**新ティア「Capybara」**として設計された。漏洩したブログ草稿によると、その特徴は以下のとおりだ。

コーディング能力

ソフトウェアコーディングテストにおいて、Opus 4.6と比較して「劇的に高いスコア」を記録。具体的なベンチマーク数値は未公表だが、Opus 4.6自体が既にコーディング分野でトップクラスの性能を持つことを考えると、そのさらに上をいく性能は業界に衝撃を与えうる。

推論能力

学術的推論テスト(academic reasoning)でも大幅なスコア向上が確認されている。これは、数学的証明、論理的推論、複雑な問題解決といったタスクで、従来のモデルを凌駕することを意味する。

サイバーセキュリティ能力

最も注目すべきは、サイバーセキュリティ分野での性能だ。Anthropicの漏洩文書には「現在、サイバー能力において他のどのAIモデルよりもはるかに先行している」と明記されている。脆弱性の発見・悪用において、防御側の対応を大幅に上回る能力を持つとされ、「前例のないサイバーセキュリティリスク」をもたらすと同社自身が警告している。

主要AIモデルとの性能比較

以下の図は、現在の主要AIモデルの性能を定性的に比較したものです。Mythosの具体的なベンチマークスコアは未公表のため、漏洩情報に基づく推定評価となっています。

AI大規模モデル性能比較表。Claude Mythos、Opus 4.6、Gemini 3 Deep Think、GPT-4.5、DeepSeek R1のコーディング・推論・サイバーセキュリティ分野を比較

モデル開発元コーディング推論サイバーセキュリティ価格帯
Claude MythosAnthropic劇的に高い劇的に高い圧倒的首位未公表(高額予想)
Claude Opus 4.6Anthropicトップクラストップクラス高い$15/100万入力トークン
Gemini 3 Deep ThinkGoogle3455 Elo48.4% (HLE)未公表AI Ultra tier
GPT-4.5OpenAI高い高い中程度$75/100万入力トークン
DeepSeek R1DeepSeek中〜高高い未公表$0.55/100万入力トークン

※ Mythosの具体的スコアは未公表。定性評価は漏洩したブログ草稿の記述に基づく。

サイバーセキュリティリスク——両刃の剣

Mythosが持つサイバーセキュリティ能力は、防御と攻撃の両面で革命的だ。

防御面でのメリット

  • 脆弱性の自動検出: コードベース全体をスキャンし、人間のセキュリティエンジニアが見逃しがちな脆弱性を発見
  • ペネトレーションテストの自動化: 侵入テストのシナリオ作成と実行を大幅に効率化
  • インシデント対応の高速化: セキュリティアラートの分析とトリアージを即座に実行

攻撃面でのリスク

Anthropic自身が「防御側の対応をはるかに上回る形で脆弱性を悪用できるモデルの波が到来する前兆」と警告している。これは以下のリスクを意味する。

  • ゼロデイ攻撃の加速: 未知の脆弱性を自律的に発見し、エクスプロイトコードを生成する可能性
  • ソーシャルエンジニアリングの高度化: 標的に合わせた精巧なフィッシングメールやなりすましの生成
  • サイバー犯罪の民主化: 高度な攻撃手法が技術力の低い攻撃者にも利用可能になるリスク

現在のステータスと今後のロードマップ

漏洩情報とAnthropicの公式回答を統合すると、Mythosの現在の状況は以下のとおりだ。

  • 訓練: 完了済み
  • テスト: 一部の早期アクセス顧客と共に制御された環境でテスト中
  • 一般公開: 時期未定。「高コストで、まだ一般リリースの準備ができていない」とされる
  • API提供: 時期未定だが、Opus同様にAPI経由での提供が予想される
  • Claude Proでの利用: 未確定。Proプラン(月額$20)での利用は制限される可能性が高く、新たな上位プランが設けられる可能性もある

Anthropicは2026年中に$3.5Bの収益を目標としており、Mythosはその中核を担うプロダクトになると見られている。

AI開発競争の現在地——3社の戦略比較

Mythosの漏洩は、AI開発競争が新たなフェーズに突入したことを示している。

項目Anthropic(Mythos)OpenAI(Spud)Google(Gemini 3 DT)
モデル状態訓練完了・テスト中事前学習完了公開済み
差別化ポイントサイバーセキュリティ経済加速・AGI科学研究・推論
公開時期未定数週間以内2026年2月〜
組織戦略安全性重視のリリースAGI Deploymentに改名AI Ultra tier展開
懸念事項サイバーリスクSora終了でリソース集中高額サブスク

3社とも「これまでで最も強力なモデル」を開発・公開しており、2026年は文字通りAIの「軍拡競争」の年となっている。

日本ではどうなるか

企業への影響

日本企業にとって、Mythosの登場はセキュリティ戦略の抜本的な見直しを迫るものになる。

  1. 防御AIの必須化: Mythosクラスのサイバー能力を持つモデルが普及すれば、従来のルールベースのセキュリティ対策では対抗不可能。AIを活用した防御体制の構築が急務
  2. セキュリティ人材の再定義: AI時代のセキュリティ人材には、AIモデルの挙動を理解し制御できるスキルが求められる
  3. 規制対応の加速: EUのAI Act や日本のAI戦略会議での議論が加速する可能性

開発者への影響

日本の開発者にとっては、Mythosの一般公開後に以下のインパクトが予想される。

  • コーディング支援の質的向上: Opus 4.6を超えるコーディング能力は、日本語でのプログラミング支援にも波及
  • セキュリティレビューの自動化: コードレビューにおける脆弱性検出が飛躍的に向上
  • コスト面の課題: 「高コスト」と明言されているため、個人開発者にとっては料金がハードルになる可能性

一般ユーザーへの影響

Claude Proユーザーがすぐに利用できるかは不透明だが、いずれ上位プランとして提供される可能性が高い。推論能力の向上は、日常的な質問応答や文章生成の品質向上に直結するため、日本語での利用体験も改善が期待できる。

まとめ——次にとるべきアクション

Claude Mythosの漏洩は、AI業界の進化速度がセキュリティ対策の進化速度を上回っていることを如実に示している。以下の3ステップで備えておこう。

  1. 情報収集を継続する: Anthropicの公式ブログとFortuneの続報を定期的にチェック。Mythosの正式発表は数週間〜数ヶ月以内と予想される
  2. セキュリティ体制を点検する: 自社のコードベースやインフラに対し、現行のAIツールを使ったセキュリティ監査を実施。Mythosクラスのモデルが攻撃に使われた場合の耐性を評価する
  3. Claude Proを試す: Mythosの一般公開前に、現行のOpus 4.6で最新のAI性能を体験しておくことで、Mythosリリース時にスムーズに移行できる。月額$20で現行最上位モデルにアクセス可能だ

Anthropicが「ステップチェンジ」と表現するMythosは、AIの能力境界を押し広げると同時に、新たなリスクの地平も切り開く。防御と攻撃、恩恵とリスクの両面を正しく理解し、来るべき変化に備えることが重要だ。

この記事をシェア