2026 年的 AI 模型里,最让网络安全圈睡不着的是一个叫 Claude Mythos 的模型。它的本事很单纯、也很吓人:你让它去找一个软件的安全漏洞,它真的找得到,而且还能写出利用那个漏洞的攻击程序。
这篇用白话解释 Anthropic 的 Claude Mythos 是什么、为什么它强到不敢公开卖,以及它跟最近很多人在问的 Claude Fable 是什么关系。
Claude Mythos 是什么
Claude Mythos(全名 Claude Mythos Preview)是 Anthropic 在 2026 年 4 月 7 日推出的模型。Anthropic 自己的定位是「为高难度任务打造的新一代智能」,主打三件事:网络安全、自主写代码,以及能跑很久的长时间任务。
它本质上是个通用模型,各方面都很强,但真正让它出名的是安全能力。
它不是给普通用户用的。Anthropic 把它定位成「研究预览版」,而且只开放给少数机构(后面会讲)。所以你在 claude.ai 上是切换不到 Mythos 的。
它最厉害的地方:自己找出漏洞
Mythos 最受瞩目的能力,是找出所谓的零日漏洞(zero-day)。
简单说,零日漏洞就是「还没被人发现、所以也还没修补」的安全漏洞。这种漏洞最危险,因为防守方根本不知道它存在。
根据 Anthropic 公布的测试,Mythos 在每一个主流操作系统、每一个主流浏览器里都找得到这种漏洞,从存在了 27 年的老问题到最新的都有,它甚至能进一步写出实际的攻击程序。一个常被拿来对比的例子是:在 Firefox 的测试里,Mythos 成功做出可用的攻击 181 次,前一代的 Opus 模型只成功 2 次。要讲清楚的是,这是在「模拟 Firefox、但拿掉浏览器内置防护」的测试环境下跑出来的,不代表它能直接打穿你电脑上那个有完整防护的 Firefox。
另外一点很关键:Anthropic 说这种找漏洞的能力,他们其实没有刻意去训练,比较像是模型在「写代码、推理、自主完成任务」整体变强之后,自然长出来的副产品。
在 Anthropic 自家的漏洞复现测试(CyberGym)里,Mythos 复现已知漏洞的成功率也明显领先前一代 Opus:

不只 Anthropic 自己说:独立验证
你可能会想:这会不会只是 Anthropic 自己老王卖瓜?这里有两个独立旁证,可信度就高很多:
- 英国官方的 AI 安全研究院(AISI) 独立测试后确认,Mythos 在网络安全能力上是一大跳跃。它是第一个能从头到尾破解该机构一道 32 步骤「企业网络攻防」关卡的 AI(10 次里成功 3 次)。
- Mozilla 更实际:光是 Firefox 150 这一个版本,他们就一口气修掉了 271 个用 Mythos 早期版本找出来的漏洞。
这两个都不是 Anthropic 自己讲的,所以「Mythos 真的很强」这件事站得住脚。不过 AISI 也诚实补了一句:Mythos 在某些情境(例如工控系统的关卡)会卡关,代表它还不是无所不能。
找得到,却来不及修
Mythos 也掀开一个尴尬的现实:AI 找漏洞的速度,已经远远超过人类修补的速度。 Anthropic 说,它找到的漏洞里,超过 99% 到公布时都还没被修好。
瓶颈从「找不到漏洞」变成「找到太多、修不完」。对防守方来说这是好消息也是压力:你终于看得见所有漏洞,但得有人力一个一个补起来。
为什么 Anthropic 不公开卖
一个能自己找漏洞、还能写攻击程序的 AI,是标准的两面刃:防守方拿它来补洞,能让世界更安全;但同样的能力落到攻击者手上,就是现成的武器。
Anthropic 的选择是不公开销售,改用一个叫 Project Glasswing 的计划,把 Mythos 开放给「会拿来做防御」的机构。
Project Glasswing(名字取自翅膀透明的「玻璃翼蝶」)是 Anthropic 的防御型计划,用 Mythos 去扫描重要的代码、提前找出漏洞修掉。它在 2026 年 4 月上线,一开始约 50 个合作伙伴;到了 2026 年 6 月 2 日,Anthropic 把名额扩大,再加入约 150 个机构、分布在 15 个以上国家,产业涵盖电力、自来水、医疗、通信、硬件等关键基础设施。参与的大厂包括 Apple、Nvidia、微软、CrowdStrike、Palo Alto Networks。
Anthropic 说,光是从 4 月到现在,这些合作伙伴就靠 Mythos 找出了超过 1 万个高风险或严重等级的漏洞。

Anthropic 也拍了一支官方视频介绍这个计划:
▶️ Project Glasswing 官方视频(YouTube)
规格一览
以下整理自 Anthropic 官方与 AWS/Google 云端平台的模型卡:
| 项目 | 内容 |
|---|---|
| 推出时间 | 2026 年 4 月 7 日 |
| 定位 | 研究预览版(网络安全/自主写代码/长时间任务) |
| 一次可读内容量 | 100 万 tokens(约等于数十万字) |
| 单次最长输出 | 12.8 万 tokens |
| 思考模式 | 自动调整深度(Adaptive thinking) |
| 知识截止 | 2025 年 12 月 |
| 图片输入 | 支持(能看懂图片) |
| 开放方式 | 不公开销售,仅通过 Project Glasswing 开放给机构 |
它跟 Claude Fable 5 有什么关系
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 与 Claude Mythos 5:两者同一个底层模型,Fable 5 是加上安全防护、对大众开放的版本;Mythos 5 解除部分防护,只给授权的网络安全、生物医学专业人士,是本文介绍的 Mythos Preview 的正式版。
想了解对大众开放、目前最强的那一支,可以看 Claude Fable 5 是什么。
小企鹅的看法
小企鹅拿不到 Mythos(它是机构限定),所以这篇是从公开信息整理的,不是实测心得。但有几个点值得普通人记住:
- AI 找漏洞的能力,已经超过多数人类专家。 这是好事也是压力:好人用它补洞会更快,但坏人也在追同样的能力。
- 「强到不敢卖」本身就是信号。 一个模型要被锁在机构手里,代表它的能力已经到了会改变攻防天平的程度。
- 这也是看懂 Fable 的钥匙。 如果 Anthropic 真要把这种能力推向大众,怎么加安全防护、开放到什么程度,会是 2026 下半年最值得盯的 AI 事件之一。
延伸阅读
整理:Penna|小企鹅 Penchan
