2026年のAIモデルの中で、セキュリティ界隈が一番気にしているのが Claude Mythos です。やることはシンプル、でも正直怖い。ソフトウェアに向かって「脆弱性を探せ」と言うと、本当に見つけてくる。しかもその脆弱性を突く攻撃コードまで書ける。

この記事では、AnthropicのClaude Mythosが何者なのか、なぜ一般販売しないのか、そして最近よく聞かれるClaude Fableとの関係を、平易な言葉で解説します。

Claude Mythosとは

Claude Mythos(正式名称:Claude Mythos Preview)は、2026年4月7日にAnthropicがリリースしたモデルです。Anthropicの説明では「高難度タスク向けの次世代インテリジェンス」と位置づけられており、三つの強みを掲げています。セキュリティ、自律的なコーディング、そして長時間にわたるタスクの持続処理です。

汎用モデルとしての総合力は高いのですが、Mythosを一躍有名にしたのはセキュリティ能力です。

一般ユーザー向けの製品ではありません。Anthropicは「研究プレビュー」と位置づけ、一部の機関にのみ提供しています。claude.aiでMythosに切り替えることはできません。

最大の特徴:自力で脆弱性を見つける

Mythosが最も注目されている能力は、ゼロデイ脆弱性(zero-day)の発見です。

ゼロデイとは、まだ誰にも見つかっていない、だから修正もされていないセキュリティの穴のことです。防御側がその存在を知らない。だから最も危険な種類の脆弱性とされています。

Anthropicが公開したテスト結果によると、Mythosはあらゆる主要OSと主要ブラウザで脆弱性を発見できており、27年前から存在していた問題から最新のものまで網羅しています。発見だけでなく、実際の攻撃コードを書くことも可能です。よく引用される比較として、Firefoxのテストでは、MythosはFirefoxに対して181回の有効な攻撃を成功させました。一方、前世代のOpusモデルは2回。ただしこれは「Firefoxをシミュレートしてブラウザ内蔵の保護を外した」テスト環境での結果であり、あなたのPCで動いている完全保護のFirefoxを直接攻略できるという意味ではありません。

重要な点が一つあります。Anthropicによれば、この脆弱性発見能力は意図的に訓練したものではなく、コーディング・推論・自律タスク処理の全体的な向上の副産物として自然に生まれたものだといいます。

Anthropic独自の脆弱性再現ベンチマーク(CyberGym)でも、Mythosは前世代のOpusを明確に上回る成績を出しています。

Anthropic CyberGym テスト:Claude Mythos PreviewはClaude Opus 4.6より高い脆弱性再現率を示す

Anthropicの自己申告だけじゃない:独立した検証

「これはAnthropicが自分で言っているだけでは?」と思う方もいるでしょう。独立した二つのデータポイントが、主張の信頼性を高めています。

  • 英国の公式AI安全研究所(AISI) が独自にテストを行い、セキュリティ能力の大きな飛躍を確認しました。Mythosは同機関の32ステップ「企業ネットワーク攻防」チャレンジを最初から最後までクリアした初のAIです(10回中3回成功)。
  • Mozilla はより実践的な形で証明しています。Firefox 150の一つのバージョンだけで、Mythosの初期版が見つけた271件の脆弱性をまとめて修正しました。

どちらもAnthropicが言っているわけではないので、「Mythosは本当に強い」という事実はかなり信頼できます。ただAISIも正直に付け加えています。Mythosは一部のシナリオ(例えば産業制御システムの課題)ではつまずくことがあり、万能ではないと。

見つけられても、修正が追いつかない

Mythosが浮き彫りにした不都合な現実があります。AIが脆弱性を見つけるスピードは、人間が修正するスピードをはるかに超えています。 Anthropicによると、Mythosが見つけた脆弱性の99%以上は、公表時点でまだ修正されていないといいます。

ボトルネックは「脆弱性が見つからない」から「多すぎて直し切れない」へと移っています。防御側にとっては朗報でもあり、プレッシャーでもある。すべての穴がようやく見えるようになったけど、一つひとつ塞いでいく人手が必要です。

なぜAnthropicは一般販売しないのか

自力で脆弱性を見つけ、攻撃コードまで書けるAIは、典型的な両刃の剣です。防御側が使えば世界はより安全になる。しかし同じ能力が攻撃者の手に渡れば、そのまま武器になります。

Anthropicの選択は一般販売しないこと。代わりに Project Glasswing というプログラムを通じて、「防御目的で使う」機関にのみMythosを提供しています。

Project Glasswing(名前は翅が透明な「グラスウィング・バタフライ」に由来)は、Mythosを使って重要なコードをスキャンし、脆弱性を事前に発見・修正するAnthropicの防御型プログラムです。2026年4月に約50のパートナーでスタートし、2026年6月2日に規模を拡大。約150機関、15カ国以上が参加し、電力・水道・医療・通信・ハードウェアなど重要インフラ産業をカバーしています。参加大手企業にはApple、Nvidia、Microsoft、CrowdStrike、Palo Alto Networksが含まれます。

Anthropicによれば、4月から現在までにパートナー各社がMythosを使って発見した高リスク・重大な脆弱性は1万件を超えるといいます。

Project Glasswing:AnthropicがClaude Mythosで重要ソフトウェアの脆弱性を発見する防御プログラム

Anthropicはこのプログラムの公式紹介動画も公開しています。

Project Glasswing 公式紹介動画

▶️ Project Glasswing 公式動画(YouTube)

スペック一覧

以下はAnthropicの公式情報およびAWS・Google Cloud上のモデルカードからまとめたものです。

項目内容
リリース日2026年4月7日
位置づけ研究プレビュー版(セキュリティ/自律コーディング/長時間タスク)
コンテキストウィンドウ100万トークン(数十万語相当)
最大出力12.8万トークン
思考モード深度自動調整(Adaptive thinking)
学習データの締め切り2025年12月
画像入力対応(画像の内容を理解できる)
提供形式一般販売なし。Project Glasswingを通じて機関限定で提供

Claude Fable 5との関係

2026年6月9日、Anthropicは Claude Fable 5Claude Mythos 5 を同時にリリースしました。両者は同じ基盤モデルを共有しており、Fable 5は安全対策を施した一般向け公開版、Mythos 5は一部の制限を外した認定セキュリティ・生医学専門家向けの版——本記事で紹介したMythos Previewの正式版にあたります。

一般向けに公開されている、現時点で最も強力なモデルについては、Claude Fable 5とは何かをご覧ください。

Penchanの所感

Mythosは機関限定なので、Penchanも実際には使えていません。この記事は公開情報をもとにまとめたもので、実使用レポートではありません。でも一般ユーザーとして覚えておく価値のある点がいくつかあります。

  1. AIが脆弱性を見つける能力は、すでに多くの人間専門家を超えています。 これは良いことでもあり、プレッシャーでもある。善意の側が使えばパッチ適用が速くなる。でも悪意のある側も同じ能力を追っています。
  2. 「強すぎて売れない」こと自体がシグナルです。 モデルが機関の中に閉じ込められるということは、その能力が攻防のバランスを変えるレベルに達したことを意味します。
  3. Fableを理解する鍵にもなります。 Anthropicがこの能力を一般向けに展開しようとしたとき、どんな安全対策を施し、どこまで開放するか。それが2026年後半で最も追いかける価値のあるAIの動きになるはずです。

あわせて読む


— Penchan