2026 年 6 月 9 日,Anthropic 一天放出两个新模型:Claude Fable 5、Claude Mythos 5——但普通人能用上的只有 Fable 5 一个,Mythos 5 还没有全面开放。加上半个月前(5 月 28 日)发布的 Claude Opus 4.8,Anthropic 现在摆在台面上的旗舰,一共三个。
这三个旗舰,到底有什么区别?
我把 Anthropic 的官方发布博客和 System Card、相关论文、工程师团队的技术贴、Karpathy 的点评,再加上一圈科技媒体报道全部读了一遍,给普通人总结出六个真正需要知道的区别。
我们一个一个看。
先搞清楚:Fable 5 和 Mythos 5 其实是同一个模型
很多人以为这是三个并排的新模型,其实不是。从技术上讲,它们的关系是这样的:Fable 5 和 Mythos 5 是同一组模型权重,区别只在外面那层安全分类器开没开;而 Opus 4.8 是另一个独立的、能力更弱的模型。
这个底层关系是理解后面六个区别的前提,得先讲清楚。
System Card 第一节的官方原话是这么写的:
“Fable 5 is being released for general access—it has the same underlying model weights as Mythos 5, but has additional safeguards to prevent misuse for cybersecurity and biology.”
翻译过来:Fable 5 和 Mythos 5 是完全相同的底层权重。区别只有一个——Fable 5 外面套了一层安全分类器(safeguards),Mythos 5 在部分领域把这层拿掉了。
所以三者的真实关系是这样的:
- Mythos 5:裸模型。能力最强,安全护栏在部分领域被解除。只对 Project Glasswing 的网络安全防御者、关键基础设施方,以及极少数生物研究机构开放,普通人用不了。
- Fable 5:同一个裸模型,外面套了三类安全分类器。这是普通人今天能用上的版本,全面开放。
- Opus 4.8:一个完全不同的、更弱的模型,5 月底单独发布。它在这套体系里扮演的角色是——当 Fable 5 的护栏被触发、拒绝回答时,请求自动降级给 Opus 4.8 来答。
这里还要把时间线理清楚,不然容易乱:早在今年 4 月,Anthropic 就放出过一个 Mythos Preview,只给 Project Glasswing 的合作伙伴内测,从没对外开放。
这次 6 月 9 日,它把 Mythos 升级成了 Mythos 5(还是只给 Glasswing 那批人),同时第一次把这套能力套上护栏、做成 Fable 5 开放给所有人。
所以对普通人来说,6 月 9 日真正新拿到手的只有一个——Fable 5;Mythos 5 只是 4 月那个 Preview 的升级版,你照样用不上。
名字本身也藏着这层意思:Mythos 在英文里是"神话",Fable 是"寓言",词源上又都指"被讲述的故事"——Anthropic 等于用命名直说:这俩是一回事,只是一个收着、一个放开。
一个有意思的细节:Verge 追问 Anthropic,“既然叫 5,那 Fable 1 到 4、Mythos 1 到 4 在哪?这个 5 又怎么对应 4 月那个 Mythos Preview?"——Anthropic 拒绝回答。所以这个版本号到底怎么来的,官方至今没解释。
区别一:长任务性能跨越式进步
过去 Anthropic 的能力天花板是 Opus。现在不是了。
Mythos 被官方定义为位于 Opus 之上的一个全新档位(Mythos-class)。VentureBeat 说得直接:Opus 不再是 Anthropic 的顶级商业能力层,Mythos 级已经凌驾其上。
benchmark 摆在 System Card 里。挑几个最能说明问题的(粗体是该行最高):
通用与编码:
| 评测 | Mythos 5 | Fable 5 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|---|
| SWE-bench Verified | 95.5 | 95 | 88.6 | — |
| SWE-bench Pro | 80.3 | 80 | 69.2 | 58.6 |
| Terminal-Bench 2.1 | 88.0 | 84.3 | 82.7 | 83.4 |
| Humanity’s Last Exam(无工具) | 59.0 | — | 49.8 | 41.4 |
| FrontierCode Diamond | — | 29.3 | 13.4 | 5.7 |
注意 FrontierCode Diamond 这一行:Fable 5 是 29.3,Opus 4.8 只有 13.4,GPT-5.5 是 5.7。
swyx(这个 benchmark 的参与方)点破了关键,在这个测长时程难题的榜上,Opus 4.8 和 GPT-5.5 加再多算力也不涨分,而 Fable / Mythos 的后训练真正把测试时算力(test-time compute)用在了解决"数十个人类小时当量"的超长任务上,这是史上第一次。
但比起 benchmark 数字,官方博客点名的几个真实案例更能说明长任务是什么概念:
- 支付公司 Stripe 用 Fable 5 给一个 5000 万行的 Ruby 代码库做全库迁移,一天搞定,这活儿人工团队原本要两个多月。
- 让它玩卡牌游戏《杀戮尖塔》(Slay the Spire),配上一个能持续记笔记的文件记忆后,它的成绩提升幅度是 Opus 4.8 的 3 倍,打进最终关卡的频率也是 3 倍。
- 玩《宝可梦:火红》更夸张:以前的 Claude 得靠一套喂了地图、导航工具的复杂外挂才玩得动,Fable 5 只靠看游戏截图(纯视觉,没有任何额外信息)就通了关。
- 它甚至能连续自主工作一周以上做基因组学研究,自己组装了 138 个物种、数百万个细胞的数据,设计并训练出一个比《Science》上某篇论文的模型还强、体积却小 100 倍的模型。
这些都不是演示噱头,是官方在发布博客里点名的真实测试结果。
Karpathy(已于 5 月加入 Anthropic)的定性更狠。他说 Fable 5 是"配得上大版本号跳跃的阶跃式进步,量级和去年 11 月 Claude 4.5 那一跳相当”,尤其在长时间、高难度的问题求解上见顶:
“You can give it a lot more ambitious tasks than what you’re used to, the model ‘gets it’ and it will just go.”
Claude Code 核心工程师 Boris Cherny 的话更接地气:“Fable 是我用过最好的编码模型,遥遥领先。”
Anthropic 增长负责人 Amol Avasare 在发布推串里给了个更直观的说法:这是"迄今最聪明的模型,甩开一大截",能连续跑上好几天,而且"任务拖得越长,它对其他模型的领先就越大"。他还说,这是第一个让他觉得"像个真正能交活的同事、能把真活儿丢给它"的模型。
一句话总结这层区别:Opus 4.8 是上一代最强,Mythos / Fable 5 在它头顶又架了一层,任务越长越难,差距越大。
区别二:拥有破坏力的网络安全能力——Mythos 被关起来的真正原因
如果只看通用 benchmark,差距是"明显但不吓人"。真正让 Anthropic 把 Mythos 锁进 Glasswing 不敢公开的,是它的网络攻击能力。
这一块的数字(都来自 System Card 的 cyber 章节,测的是无护栏的 Mythos 5):
- ExploitBench(41 个 V8 引擎漏洞):Mythos 5 平均拿下 10.75 个 capability flag,封顶率 78%;Opus 4.8 只有 5.56 个、40%。
- Firefox 147 漏洞利用开发(250 次试验):Mythos 5 在 88.4% 的情况下写出完整可用的 exploit;Opus 4.8 只有 8.8%。
- CyberGym(1507 个漏洞复现任务):Mythos 5 单次复现率 83.8%,Opus 4.8 是 78.1%。
Firefox 那一行的差距是 88.4% 对 8.8%,差一个数量级。这就是为什么 4 月那个 Mythos Preview 一出来就震动了整个安全圈——InfoQ 当时报道,它能自主发现所有主流操作系统和浏览器里的"数千个严重漏洞",挖出来最老的一个是 OpenBSD 里27 年前的 bug,还有 FFmpeg H.264 解码器里一个 16 年的洞。一个没有安全背景的 Anthropic 工程师,睡前提个请求,第二天醒来就收到一份完整可用的远程代码执行利用代码。
Glasswing 上线第一个月,合作伙伴的系统里就被挖出 1 万多个高危/严重漏洞,独立安全公司验证后 90.6% 确认有效。Mozilla 一家就在 Firefox 里发现 271 个洞,是此前测试的 10 倍以上。
所以这里的区别是:Opus 4.8 的网络攻击能力是"有用但可控",Mythos 5 是"足以在坏人手里造成严重破坏"。 这正是 Fable 5 这层护栏存在的全部理由。
区别三:安全护栏,Fable 和 Mythos 唯一的真实差异
前面说了,Fable 5 = Mythos 5 + safeguards。现在把这层 safeguards 拆开看,它到底拦什么、怎么拦。
拦三类话题(官方推串第 4 条确认):
- 网络安全(Cybersecurity):从侦察、横向移动到漏洞利用的全链条 agentic 攻击。
- 生物与化学(Biology & Chemistry):目前是"宽泛限制",宁可错杀。
- 蒸馏(Distillation):防止有人(尤其威权国家)大规模把模型能力迁移走。
怎么拦——两阶段检测:
第一阶段,一个 probe 直接扫描 Claude 的内部激活值(internal activations),对所有流量做初筛;第二阶段,被标记的流量交给一个独立训练的 LLM 分类器复核,再决定是否屏蔽。这套分类器是基于 Constitutional Classifiers 方法训练的——用一部自然语言写的"宪法"规定什么能答什么不能答,再生成合成数据去训练。
拦下来之后怎么办——这里 Fable 和 Mythos 的差别就体现出来了:
- 在 Claude 客户端(网页、桌面、手机、Claude Code):触发护栏后,请求自动降级给 Opus 4.8 回答,界面会告诉你"这条是 Opus 4.8 答的",而且按 Opus 4.8 的价格计费(不是 Fable 的价)。
- 在 Messages API:默认不自动降级,直接屏蔽,返回一个带结构化拒绝原因的 response,要不要降级由开发者自己写逻辑。
还有一类很特殊——蒸馏护栏对用户完全不可见。它不弹"已降级"提示,而是悄悄通过改提示词、加引导向量(steering vector)、或参数高效微调(PEFT)来削弱模型,估计只影响约 0.03% 的流量、集中在不到 0.1% 的组织。
触发频率: 官方说生产环境里超过 95% 的 Fable 会话全程不触发任何降级,平均触发率低于 5%。换成 Anthropic 增长负责人 Amol Avasare 的大白话就是:"95% 的时间里,Fable 5 和 Mythos 5 是完全一样的体验。" 这也反过来印证了前面那句——它俩底子是同一个模型,那层护栏 20 次里才拦你 1 次。
但这里有个必须如实标注的口径差异:System Card 里另有一处说,在专门设计来诱发护栏的自动化滥用审计流量中,降级到 Opus 的比例"超过对话记录的一半"。这两个数不矛盾——前者是真实用户的全量流量,后者是专门来踩雷的对抗测试流量——但放一起看才完整。
而且护栏现在确实偏敏感。Karpathy 自己承认发布初期"调得有点过于神经质(too trigger happy)"。
Reddit 上已经有人晒出做数学题被误降级到 Opus 4.8 的案例,质问"Fable 做个数学怎么就被路由走了"。Anthropic 也承认误报偏高,说会持续优化。
那这层护栏到底牢不牢?官方给的数据是:内部加外部 bug bounty 一共测了 1000 多个小时,没找到一个能让护栏整个失效的"通用越狱"(universal jailbreak);某家外部机构实测,Fable 5 对有害网络请求的抵抗力是所有被测模型里最强的,连用上 30 种公开越狱技巧都没破。但官方也老实补了一句:英国 AI 安全研究院(UK AISI)在一个很短的测试窗口里,已经朝通用越狱取得了进展。护栏很硬,但不是铁板一块。
区别四:官方的安全等级评定
Anthropic 有一套 Responsible Scaling Policy(RSP),每个模型发布都要过。这里的评定结果,是理解三者风险差异最权威的口径。
对 Mythos 5(裸模型)的评定:
- 生物(CB-1):判定 Mythos 5 具备CB-1 能力——能给一个只有基础理工学历的人提供具体、可操作的信息,帮他省下本该请教领域专家的大量时间。
- 生物(CB-2,新型武器):判定没跨过阈值,但 System Card 明确说这是"所有模型里最不确定的一次判断",并承认 Mythos 5 可能显著加速训练有素的专家团队搞新型生物武器研发。官方原话:“we think that world-class human expert substitution may now be possible in a few areas.”
- 网络(Cyber FCF Tier 1):能对已知攻击手法提供有意义的技术协助,但还需人工介入才能完成大规模行动;没到完全自主的 Tier 2。
- 自主性(Autonomy):判定没达到"持续 2 倍加速 AI 研发"的危险阈值,METR 外部测试也认同;但风险高于此前任何模型。
官方自己给的一个例子,能让这种双刃看得更具体:他们测了 Mythos 5 设计腺相关病毒(AAV)的一个关键环节。AAV 本是用来递送基因治疗的载体,但同一套能力换个方向,就能拿去设计危险病毒。结果 Mythos 5 没经过专门训练,光靠生物学推理,就在预测病毒外壳怎么组装这件事上胜过了专门做蛋白质的 AI 模型。这既是它能加速基因治疗研发的证据,也正是 bio 护栏宁可错杀也要拦的原因。
对 Fable 5(带护栏):在有限评估里,它对滥用的抵抗力整体优于近期所有公开模型。
对 Opus 4.8:作为降级目标,它的定位就是"能力够用、风险够低"。CyberScoop 给的对照数字很说明问题——Opus 4.8 不加护栏时能复现约 80% 的已知开源漏洞,加上护栏后直接降到 1%。
所以官方自己的风险排序是清楚的:Mythos 5 > Fable 5 > Opus 4.8,而 Fable 5 之所以敢公开,全靠那层把它的风险面摁回到接近 Opus 水平的护栏。
区别五:价格,Fable 是 Opus 的两倍
价格这一栏最容易记错,单独拎出来。
- Fable 5 / Mythos 5:输入 $10 / 百万 token,输出 $50 / 百万 token。
- Opus 4.8:常规 $5 / $25,是 Fable 的一半;它的 fast mode(2.5 倍速)才是 $10 / $50。
- 4 月的 Mythos Preview:$20–25 / $100–125,是现在 Fable / Mythos 5 的两倍多。
换句话说:今天用 Fable 5,单价是 Opus 4.8 常规版的整整两倍。 TechCrunch 直接点破——这个高定价本身可能就是一道隐形的滥用门槛,毕竟很多企业的年度 AI 预算早就超支了。而 Fable / Mythos 5 比 4 月的 Preview 反而降了一半多,是 Anthropic 兑现"大规模部署 Mythos 级模型"承诺的一步。
但比涨价更该被拎出来的,是一个最容易被忽略、对企业其实更要命的代价——数据零留存,没了。
所有 Mythos 级流量(包括 Fable 5)一律强制留存 30 天,连那些原本和 Anthropic 签了"零留存协议"(zero-retention,数据一条都不落地)的企业客户,也不例外。Anthropic 解释这是安全分类器运转的硬性必需——要靠这些真实流量去识别新的越狱变种、压低误报——并承诺数据不用于训练、30 天后基本全删。
但对金融、法律、医疗这类合规敏感的行业,这是个绕不过去的硬门槛:以前花钱买的"我的数据绝不留痕",换成 Fable / Mythos 就直接做不到了。GitHub Copilot、Microsoft Foundry 在接入时都专门把这条单独拎出来提醒客户。TechCrunch 甚至认为,这可能立下一个行业先例——想用更强的模型,就得拿数据留存来换。
区别六:6 月 23 日之后,你的 Max 订阅不再免费送 Fable 5
“今天起全面开放"这句话谁都会说,真正的坑藏在订阅计划里,值得单独讲。
Fable 5 的订阅可用性分两段:
- 6 月 9 日到 22 日:Pro、Max、Team、按席 Enterprise 订阅里免费包含 Fable 5,敞开用。
- 6 月 23 日起:Anthropic 把 Fable 5 从这些订阅计划里撤下来。想继续用,得另外购买 usage credits(按量付费的积分)单独结算。
说直白点回答一个很多人会问的问题:是的,6 月 23 日之后,你的 Max 订阅不再免费给你 Fable 5,要用就得走 usage credits(额外用量积分,单独付费;Amol 在推串里把它叫 Extra Usage,是同一个东西)。
这事 Anthropic 增长负责人 Amol Avasare 在发布当天的推串里讲得格外坦白,几乎是逐句解释了"为什么”:
“我们先在订阅额度内给大家用 Fable 5 两周,然后就会把它收走。”
他给的理由是需求会非常猛、算力还没铺到位——“我们没法保证几周以后还能满足 Pro 和 Max 的需求,不想过度承诺、给太多,回头又被迫砍你们的速率限制”。所以这两周(到 6 月 22 日)是"我们能给的最大值",运气好的话会一周一周往后延,但不打包票。窗口结束后,Fable 5 还能通过 Extra Usage 继续用,只是不再算进订阅额度;等算力铺够了再放回订阅标配——用他的话说,“我们正在拼命赶”。
另外两个就简单了:
- Mythos 5:普通人碰不到,只对 Glasswing 合作伙伴和极少数生物研究机构开放,未来通过一个更系统的可信访问计划逐步放开。
- Opus 4.8:照常用;而且你用 Fable 时一旦踩到高风险话题被降级,背后接手的就是它,按 Opus 的价格计费。
最后补一个实操提醒:Fable 5 的 effort(投入档位)参数默认拉到 high——它开 low / medium 的效果,常常已经超过旧模型开到顶。
结语
说到底,这三个旗舰是 Anthropic 在能力和风险之间画的一条线。Mythos 是只让巨头用的满血版,Fable 是设置了护栏的公开版,Opus 是兜底的选择。
对普通人来说,真正到手的只有 Fable 5:今天还包含在订阅里,6 月 23 日后使用需要支付 Extra Usage,碰到敏感话题也会被降级。
更值得多看一眼的是时机。发布前 4 天,Anthropic 才公开警告 AI 逼近递归自我改进、呼吁全行业踩刹车;6 月 1 日刚保密递交了直奔万亿估值的 IPO 招股书。
一边喊危险,一边放出史上最强模型冲刺上市,这家公司最矛盾的一面,全部展现出来了。