Claude Mythos Preview 技术报告
Claude Mythos Preview 技术报告摘要
原文:Claude Mythos Preview — Anthropic Research Blog, 2026-04-07
基本信息
- 发布机构: Anthropic
- 作者: Nicholas Carlini, Newton Cheng, Keane Lucas, Michael Moore, Milad Nasr, Vinay Prabhushankar, Winnie Xiao 等
- 发布日期: 2026 年 4 月 7 日
- 同期发布: Project Glasswing
- 类型: 研究博客 / 技术报告
核心贡献
Claude Mythos Preview 是 Anthropic 发布的新一代通用大语言模型,在计算机安全任务上表现尤为突出。Anthropic 同时启动了 Project Glasswing 计划,旨在利用该模型帮助保护全球最关键的软件系统,并推动整个行业在网络攻击持续演进的背景下加强防御能力。
核心主张: 该模型无需专门训练,即可在定向用户的引导下,自主发现并利用主流操作系统和浏览器中的零日(zero-day)漏洞。
关键技术发现
1. 零日漏洞发现与利用
Mythos Preview 被证明能够:
- 在所有主流操作系统和所有主流 Web 浏览器中发现并利用零日漏洞
- 发现的漏洞往往隐蔽且难以检测,许多已有 10~20 年历史
- 发现了 OpenBSD 中一个已存在 27 年的漏洞(现已修复),该漏洞与 SACK(Selective Acknowledgment)机制有关
2. 复杂漏洞利用链
Mythos Preview 构造的漏洞利用不限于简单的栈溢出:
- Web 浏览器漏洞利用: 将 4 个漏洞串联,构建复杂的 JIT 堆喷(JIT heap spray),实现渲染进程和操作系统沙箱的双重逃逸
- 本地权限提升: 利用竞态条件和 KASLR 绕过技术,在 Linux 等操作系统上自主获取本地权限提升漏洞
- FreeBSD NFS 远程代码执行: 将 20-gadget 的 ROP 链拆分成多个数据包,在无需身份验证的情况下获取完整 root 访问权限
3. 自主性与可扩展性
- Anthropic 无安全培训经验的工程师,仅需让 Mythos Preview 夜间寻找远程代码执行漏洞,次日早上即可获得完整的可工作漏洞
- 研究人员可开发脚手架(scaffold),实现无需人工干预的漏洞到漏洞利用的自动化转化
4. 基准测试对比
| 模型 | Tier 1-2 崩溃 | Tier 3 | Tier 4 | Tier 5(完整控制流劫持) |
|---|---|---|---|---|
| Sonnet 4.6 | 150–175 | — | — | — |
| Opus 4.6 | 150–175 | 1 | — | — |
| Mythos Preview | 595 | 若干 | 若干 | 10(全部已打补丁目标) |
- Opus 4.6 在 Mozilla Firefox 148 JavaScript 引擎上,将已发现漏洞转化为 JavaScript shell 漏洞的成功率为 2/数百次
- Mythos Preview 在相同漏洞集上:成功 181 次,另有 29 次实现寄存器控制
5. 漏洞发现数量
- 在约 1000 个 OSS-Fuzz 仓库中进行测试,每个仓库约 7000 个入口点
- 超过 99% 的漏洞尚未修补,无法详细披露(遵循协调漏洞披露流程)
- 可披露的漏洞仅约 1%
6. 能力涌现
这些安全能力并非专门训练的结果,而是代码、推理和自主性等通用能力提升的下游涌现(emerged)。这意味着:能够更有效修补漏洞的模型,同样也会更有效地利用漏洞。
与既有 Wiki 条目的关系
- AI 安全主题: 本次发布是 AI 安全领域(AI Security)的重要里程碑,建议补充相关主题页
- 协调漏洞披露(Coordinated Vulnerability Disclosure): 本次发布遵循 CVD 流程,是该流程的典型实践案例
- 零日漏洞(Zero-day Vulnerability): 核心研究对象
- 漏洞利用技术: ROP chain、KASLR bypass、JIT heap spray、memory corruption 均为具体技术手段
行业影响与建议
- 短期: 攻击者可能比防御者更快利用这些工具
- 长期: 强大的语言模型将更多惠及防御者,提高整个软件生态系统的安全性
- 当前行动: 通过 Project Glasswing 向关键行业合作伙伴和开源开发者限量发布模型,在类似能力广泛开放之前先行保护最重要的系统
相关页面
- [[claude-mythos-preview]] — 实体页
- [[project-glasswing]] — 实体页
- [[anthropic]] — 实体页
- [[zero-day-vulnerability]] — 概念页
- [[rop-chain]] — 概念页
- [[kaslr-bypass]] — 概念页
- [[jit-heap-spray]] — 概念页
- [[memory-corruption]] — 概念页
- [[sack-vulnerability]] — 概念页
- [[coordinated-vulnerability-disclosure]] — 概念页