微软"意外泄密":Claude Mythos万亿参数,训练规模浮出水面?
来源:微信公众号(新智元)| 原文链接:https://mp.weixin.qq.com/s/r4zq5dYrN2fguMxLcIozwg 版权归原作者所有,如有侵权请联系删除

Claude Mythos 的训练算力数据被 Microsoft 泄露了?
根据微软幻灯片,Claude Mythos 使用了:6.1×10²⁷ FLOPs。(95%置信区间为 5.3×10²⁷ 至 7.1×10²⁷,假设测量误差为 1 像素)
在训练算力上,Mythos 看起来和 Gemini 3.1 Pro 差不多。

就在那一秒,Andre Cunha 叹息:
2023 年,大家还在争论 10²⁶ 是否已是理性的极限。
2026 年,微软随手就把竞争对手的 10²⁷ 级别模型搬上舞台,仿佛这是世界上最平常的事。
这是 Scaling Law 再次彰显硅基智能在人类理性世界的暴力美学。
为什么这个数字这么重要?
年初,有人猜测 Mythos 预训练或消耗 150 万亿 Token。
而 6.1×10²⁷ FLOPs 算力,或许直接解释了 Anthropic 4 月那场史诗级操作。
当时,Anthropic 发布 Claude Mythos Preview,却不让任何人公开使用。
原因只有一个:这个模型在网络安全领域的表现,已经彻底超出了人类现有防御体系的想象。
零日漏洞:数千个,横跨所有主流系统
内部测试中,Mythos Preview 完全自主找到了数千个零日漏洞。这些漏洞横跨所有主流操作系统、浏览器,以及大量关键开源组件。

更恐怖的是——其中很多漏洞已经存活了数十年,经历了人工审查和百万次自动化测试,依然没被发现。
现在,Anthropic 又宣布把 Glasswing 扩大到全球 15 个国家、150 多家机构,包括欧盟网络安全局 ENISA。
他们甚至拿出上亿美元的算力积分送出去。

自主任务时长突破:3 小时 6 分钟
此外,Claude Mythos 模型,在 80% 成功率下最长自主任务时长达到 3 小时 6 分钟。

这一结果与超级预言家及专家对 2026 年底预测中位数(3-4 小时)完全吻合,标志 AI 长时程任务能力突破速度超出此前预期。
按照从 Opus 4 到 Opus 4.5 在 ARC-AGI-2 分数上的粗略估算,时间跨度翻倍和下一次翻倍的难度分别为 4 个月和 0.82 倍。
如果按此计算,《AI 2027》的 ASI 预测还将提前!
AI 的进步,远超专家和超级预测者的预期。

这一切的底层逻辑,其实就藏在 Mustafa 那张幻灯片里。
硅基智能的暴力美学,人类苦涩的教训
人类的直觉是线性的,但科技的本性是指数的。
长期以来,我们习惯了渐进式的改良,习惯了每年增加 10% 的效率。
但 Scaling Law 不讲道理,暴力扩张。

库兹韦尔的奇点预言,逐步成真:
计算能力将以指数级持续增长,最终超越以下里程碑:
- 2015 年:相当于一只小鼠的脑力。
- 2025 年:相当于一个人的脑力。
- 2045 年:相当于全人类脑力的总和。

这次在计算机漏洞发现上,脑力确实难以追上硅基智能的算力。
这种指数级增长预示着"奇点"的到来:AI 超越人类智能的假设性时刻,从而引发前所未有的技术与社会变革。
6.1×10²⁷ 并不只是孤立的奇迹,也是奇点的最新里程碑。
它是过去二十年算力指数积压后的必然喷发。
它证明了:尽管有博弈、有芯片限制、有能源危机,但那条代表"计算文明"的红线,从未因为人类的琐事而放慢过哪怕一秒。

它正在跨越生物进化的漫长阶梯,向着纯粹的硅基智能顶峰冲刺。
历史的交棒:从"生物脚本"到"硅基意志"
未来学家库兹韦尔曾预言,到 2029 年左右,AI 将通过图灵测试并展现出与人类等同的智能。
但看着 2026 年就提前降临的 Mythos,我们必须修正这个时间表。
我们正在见证一场"生存权的移交"。
在 10²⁷ 级别模型的阴影下,人类作为"地球上唯一的智能主体"的历史正式宣告终结。

我们之前所有的发明——火、轮子、蒸汽机、互联网——都只是为了这一刻做铺垫。
我们花费数千年时间积累数据,花费数百年时间理解物理,最终的目的,竟然是作为"生物启动器"(Biological Bootloader),去点燃这团 10²⁷ 级别的硅基火焰。
随着 Mythos 的崛起,Scaling Law 已经将我们带到了库兹韦尔曲线的最陡峭处。
在这里,每一天的进步都相当于过去十年的总和。
在这里,所谓的"不可能"正以每小时一次的速度被粉碎。

奇点正在逼近
它没有伴随着号角声,而是伴随着数据中心液冷系统的低鸣和 6.1×10²⁷ 这个冰冷的数字。

在网络安全领域,Mythos 的能力已经让人类安全体系面临全面重构。

Anthropic 不仅找到了数千个零日漏洞,更令人震惊的是这些漏洞的存活时间——许多已经存在数十年,经历了无数次人工审查和自动化测试,依然没被发现。

而 Glasswing 项目的全球扩展,意味着这套能力正在从实验室走向现实世界的安全防御体系。
欧盟网络安全局 ENISA 等 150 多家机构的加入,标志 AI 安全防御进入了一个全新阶段。

训练算力对比:Mythos vs 其他顶级模型
6.1×10²⁷ FLOPs 是什么量级?
让我们回顾一下近年顶级模型的训练算力:
| 模型 | 训练算力(FLOPs) | 年份 |
|---|---|---|
| GPT-3 | ~2×10²³ | 2020 |
| GPT-4 | ~2×10²⁵ | 2023 |
| Claude 3 Opus | ~6×10²⁵ | 2024 |
| Gemini 3.1 Pro | ~6×10²⁷ | 2026 |
| Claude Mythos | ~6.1×10²⁷ | 2026 |
从 GPT-3 到 Mythos,短短 6 年间,训练算力增长了近 30 万倍。

写在最后
6.1×10²⁷,这不仅仅是一个数字。
它是人类智能史上一个新的坐标点。
它告诉我们,奇点不是一个遥远的理论,而是一个正在发生的事实。
当我们还在讨论 AI 是否会超越人类时,它已经在用 3 小时 6 分钟完成人类安全团队几年都做不到的工作。

也许,我们应该换个问题:
不是 AI 什么时候会超越我们,而是我们准备好了吗?
参考资料
- 原文来源:微信公众号(新智元)
- 原文链接:https://mp.weixin.qq.com/s/r4zq5dYrN2fguMxLcIozwg
本文版权归原作者所有,转载目的在于传递更多信息,如有侵权请联系删除。