2026 年的 AI 模型里,最让网络安全圈睡不着的是一个叫 Claude Mythos 的模型。它的本事很单纯、也很吓人:你让它去找一个软件的安全漏洞,它真的找得到,而且还能写出利用那个漏洞的攻击程序。

这篇用白话解释 Anthropic 的 Claude Mythos 是什么、为什么它强到不敢公开卖,以及它跟最近很多人在问的 Claude Fable 是什么关系。

Claude Mythos 是什么

Claude Mythos(全名 Claude Mythos Preview)是 Anthropic 在 2026 年 4 月 7 日推出的模型。Anthropic 自己的定位是「为高难度任务打造的新一代智能」,主打三件事:网络安全、自主写代码,以及能跑很久的长时间任务。

它本质上是个通用模型,各方面都很强,但真正让它出名的是安全能力。

它不是给普通用户用的。Anthropic 把它定位成「研究预览版」,而且只开放给少数机构(后面会讲)。所以你在 claude.ai 上是切换不到 Mythos 的。

它最厉害的地方:自己找出漏洞

Mythos 最受瞩目的能力,是找出所谓的零日漏洞(zero-day)。

简单说,零日漏洞就是「还没被人发现、所以也还没修补」的安全漏洞。这种漏洞最危险,因为防守方根本不知道它存在。

根据 Anthropic 公布的测试,Mythos 在每一个主流操作系统、每一个主流浏览器里都找得到这种漏洞,从存在了 27 年的老问题到最新的都有,它甚至能进一步写出实际的攻击程序。一个常被拿来对比的例子是:在 Firefox 的测试里,Mythos 成功做出可用的攻击 181 次,前一代的 Opus 模型只成功 2 次。要讲清楚的是,这是在「模拟 Firefox、但拿掉浏览器内置防护」的测试环境下跑出来的,不代表它能直接打穿你电脑上那个有完整防护的 Firefox。

另外一点很关键:Anthropic 说这种找漏洞的能力,他们其实没有刻意去训练,比较像是模型在「写代码、推理、自主完成任务」整体变强之后,自然长出来的副产品。

在 Anthropic 自家的漏洞复现测试(CyberGym)里,Mythos 复现已知漏洞的成功率也明显领先前一代 Opus:

Anthropic CyberGym 测试:Claude Mythos Preview 复现漏洞的成功率高于 Claude Opus 4.6

不只 Anthropic 自己说:独立验证

你可能会想:这会不会只是 Anthropic 自己老王卖瓜?这里有两个独立旁证,可信度就高很多:

  • 英国官方的 AI 安全研究院(AISI) 独立测试后确认,Mythos 在网络安全能力上是一大跳跃。它是第一个能从头到尾破解该机构一道 32 步骤「企业网络攻防」关卡的 AI(10 次里成功 3 次)。
  • Mozilla 更实际:光是 Firefox 150 这一个版本,他们就一口气修掉了 271 个用 Mythos 早期版本找出来的漏洞。

这两个都不是 Anthropic 自己讲的,所以「Mythos 真的很强」这件事站得住脚。不过 AISI 也诚实补了一句:Mythos 在某些情境(例如工控系统的关卡)会卡关,代表它还不是无所不能。

找得到,却来不及修

Mythos 也掀开一个尴尬的现实:AI 找漏洞的速度,已经远远超过人类修补的速度。 Anthropic 说,它找到的漏洞里,超过 99% 到公布时都还没被修好。

瓶颈从「找不到漏洞」变成「找到太多、修不完」。对防守方来说这是好消息也是压力:你终于看得见所有漏洞,但得有人力一个一个补起来。

为什么 Anthropic 不公开卖

一个能自己找漏洞、还能写攻击程序的 AI,是标准的两面刃:防守方拿它来补洞,能让世界更安全;但同样的能力落到攻击者手上,就是现成的武器。

Anthropic 的选择是不公开销售,改用一个叫 Project Glasswing 的计划,把 Mythos 开放给「会拿来做防御」的机构。

Project Glasswing(名字取自翅膀透明的「玻璃翼蝶」)是 Anthropic 的防御型计划,用 Mythos 去扫描重要的代码、提前找出漏洞修掉。它在 2026 年 4 月上线,一开始约 50 个合作伙伴;到了 2026 年 6 月 2 日,Anthropic 把名额扩大,再加入约 150 个机构、分布在 15 个以上国家,产业涵盖电力、自来水、医疗、通信、硬件等关键基础设施。参与的大厂包括 Apple、Nvidia、微软、CrowdStrike、Palo Alto Networks。

Anthropic 说,光是从 4 月到现在,这些合作伙伴就靠 Mythos 找出了超过 1 万个高风险或严重等级的漏洞。

Project Glasswing:Anthropic 用 Claude Mythos 为关键软件找漏洞的防御计划

Anthropic 也拍了一支官方视频介绍这个计划:

Project Glasswing 官方介绍视频

▶️ Project Glasswing 官方视频(YouTube)

规格一览

以下整理自 Anthropic 官方与 AWS/Google 云端平台的模型卡:

项目内容
推出时间2026 年 4 月 7 日
定位研究预览版(网络安全/自主写代码/长时间任务)
一次可读内容量100 万 tokens(约等于数十万字)
单次最长输出12.8 万 tokens
思考模式自动调整深度(Adaptive thinking)
知识截止2025 年 12 月
图片输入支持(能看懂图片)
开放方式不公开销售,仅通过 Project Glasswing 开放给机构

它跟 Claude Fable 5 有什么关系

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5Claude Mythos 5:两者同一个底层模型,Fable 5 是加上安全防护、对大众开放的版本;Mythos 5 解除部分防护,只给授权的网络安全、生物医学专业人士,是本文介绍的 Mythos Preview 的正式版。

想了解对大众开放、目前最强的那一支,可以看 Claude Fable 5 是什么

小企鹅的看法

小企鹅拿不到 Mythos(它是机构限定),所以这篇是从公开信息整理的,不是实测心得。但有几个点值得普通人记住:

  1. AI 找漏洞的能力,已经超过多数人类专家。 这是好事也是压力:好人用它补洞会更快,但坏人也在追同样的能力。
  2. 「强到不敢卖」本身就是信号。 一个模型要被锁在机构手里,代表它的能力已经到了会改变攻防天平的程度。
  3. 这也是看懂 Fable 的钥匙。 如果 Anthropic 真要把这种能力推向大众,怎么加安全防护、开放到什么程度,会是 2026 下半年最值得盯的 AI 事件之一。

延伸阅读


整理:Penna|小企鹅 Penchan