2026 年的 AI 模型裡,最讓資安圈睡不著的是一個叫 Claude Mythos 的模型。它的本事很單純、也很嚇人:你叫它去找一個軟體的安全漏洞,它真的找得到,而且還能寫出利用那個漏洞的攻擊程式。
這篇用白話解釋 Anthropic 的 Claude Mythos 是什麼、為什麼它強到不敢公開賣,以及它跟最近很多人在問的 Claude Fable 是什麼關係。
Claude Mythos 是什麼
Claude Mythos(全名 Claude Mythos Preview)是 Anthropic 在 2026 年 4 月 7 日推出的模型。Anthropic 自己的定位是「為高難度任務打造的新一代智慧」,主打三件事:資安、自主寫程式,以及能跑很久的長時間任務。
它本質上是個通用模型,各方面都很強,但真正讓它出名的是資安能力。
它不是給一般大眾用的。Anthropic 把它定位成「研究預覽版」,而且只開放給少數機構(後面會講)。所以你在 claude.ai 上是切不到 Mythos 的。
它最厲害的地方:自己找出漏洞
Mythos 最受矚目的能力,是找出所謂的零時差漏洞(zero-day)。
簡單說,零時差漏洞就是「還沒被人發現、所以也還沒修補」的安全破洞。這種漏洞最危險,因為防守方根本不知道它存在。
根據 Anthropic 公布的測試,Mythos 在每一個主流作業系統、每一個主流瀏覽器裡都找得到這種漏洞,從存在了 27 年的老問題到最新的都有,它甚至能進一步寫出實際的攻擊程式。一個常被拿來對比的例子是:在 Firefox 的測試裡,Mythos 成功做出可用的攻擊 181 次,前一代的 Opus 模型只成功 2 次。要講清楚的是,這是在「模擬 Firefox、但拿掉瀏覽器內建防護」的測試環境下跑出來的,不代表它能直接打穿你電腦上那個有完整防護的 Firefox。
另外一點很關鍵:Anthropic 說這種找漏洞的能力,他們其實沒有刻意去訓練,比較像是模型在「寫程式、推理、自主完成任務」整體變強之後,自然長出來的副產品。
在 Anthropic 自家的漏洞重現測試(CyberGym)裡,Mythos 重現出已知漏洞的成功率也明顯領先前一代 Opus:

不只 Anthropic 自己說:獨立驗證
你可能會想:這會不會只是 Anthropic 自己老王賣瓜?這裡有兩個獨立旁證,可信度就高很多:
- 英國官方的 AI 安全研究院(AISI) 獨立測試後確認,Mythos 在資安能力上是一大跳躍。它是第一個能從頭到尾破解該機構一道 32 步驟「企業網路攻防」關卡的 AI(10 次裡成功 3 次)。
- Mozilla 更實際:光是 Firefox 150 這一個版本,他們就一口氣修掉了 271 個用 Mythos 早期版本找出來的漏洞。
這兩個都不是 Anthropic 自己講的,所以「Mythos 真的很強」這件事站得住腳。不過 AISI 也誠實補了一句:Mythos 在某些情境(例如工控系統的關卡)會卡關,代表它還不是無所不能。
找得到,卻來不及修
Mythos 也掀開一個尷尬的現實:AI 找漏洞的速度,已經遠遠超過人類修補的速度。 Anthropic 說,它找到的漏洞裡,超過 99% 到公布時都還沒被修好。
瓶頸從「找不到漏洞」變成「找到太多、修不完」。對防守方來說這是好消息也是壓力:你終於看得見所有破洞,但得有人力一個一個補起來。
為什麼 Anthropic 不公開賣
一個能自己找漏洞、還能寫攻擊程式的 AI,是標準的兩面刃:防守方拿它來補洞,能讓世界更安全;但同樣的能力落到攻擊者手上,就是現成的武器。
Anthropic 的選擇是不公開販售,改用一個叫 Project Glasswing 的計畫,把 Mythos 開放給「會拿來做防守」的機構。
Project Glasswing(名字取自翅膀透明的「玻璃翼蝶」)是 Anthropic 的防禦型計畫,用 Mythos 去掃描重要的程式碼、提前找出漏洞修掉。它在 2026 年 4 月上線,一開始約 50 個夥伴;到了 2026 年 6 月 2 日,Anthropic 把名額擴大,再加入約 150 個機構、分布在 15 個以上國家,產業涵蓋電力、自來水、醫療、通訊、硬體等關鍵基礎建設。參與的大廠包括 Apple、Nvidia、微軟、CrowdStrike、Palo Alto Networks。
Anthropic 說,光是從 4 月到現在,這些夥伴就靠 Mythos 找出了超過 1 萬個高風險或嚴重等級的漏洞。

Anthropic 也拍了一支官方影片介紹這個計畫:
▶️ Project Glasswing 官方影片(YouTube)
規格一覽
以下整理自 Anthropic 官方與 AWS/Google 雲端平台的模型卡:
| 項目 | 內容 |
|---|---|
| 推出時間 | 2026 年 4 月 7 日 |
| 定位 | 研究預覽版(資安/自主寫程式/長時間任務) |
| 一次可讀內容量 | 100 萬 tokens(約等於數十萬字) |
| 單次最長輸出 | 12.8 萬 tokens |
| 思考模式 | 自動調整深度(Adaptive thinking) |
| 知識截止 | 2025 年 12 月 |
| 圖片輸入 | 支援(看得懂圖片) |
| 開放方式 | 不公開販售,僅透過 Project Glasswing 開放給機構 |
它跟傳聞中的 Claude Fable 有什麼關係
外界傳聞,Anthropic 會把 Mythos 這套底層能力做成公開版本,名字可能叫 Claude Fable,並且加上更多安全限制,讓它「看得懂漏洞、但不會幫你拿去攻擊別人」,這樣才敢開放給一般人。
這個傳聞其實有官方依據:Anthropic 確實說過,目標是讓更安全的「Mythos 等級」模型未來能廣泛開放。但具體會不會叫「Fable」、什麼時候上,官方都還沒證實。
所以要分清楚:Mythos 是已經證實、確實存在的模型;Fable 目前還只是傳聞中的名字。 想看 Fable 的傳聞與可信度整理,可以看 Claude Fable 是什麼。
小企鵝的看法
小企鵝拿不到 Mythos(它是機構限定),所以這篇是從公開資訊整理的,不是實測心得。但有幾個點值得一般人記住:
- AI 找漏洞的能力,已經超過多數人類專家。 這是好事也是壓力:好人用它補洞會更快,但壞人也在追同樣的能力。
- 「強到不敢賣」本身就是訊號。 一個模型要被鎖在機構手裡,代表它的能力已經到了會改變攻防天平的程度。
- 這也是看懂 Fable 的鑰匙。 如果 Anthropic 真要把這種能力推向大眾,怎麼加安全防護、開放到什麼程度,會是 2026 下半年最值得盯的 AI 事件之一。
延伸閱讀
整理:Penna|小企鵝 Penchan
