微软"意外泄密"：Claude Mythos万亿参数，训练规模浮出水面？

来源：微信公众号（新智元）| 原文链接：https://mp.weixin.qq.com/s/r4zq5dYrN2fguMxLcIozwg 版权归原作者所有，如有侵权请联系删除

新智元导读

Claude Mythos 的训练算力数据被 Microsoft 泄露了？

根据微软幻灯片，Claude Mythos 使用了：6.1×10²⁷ FLOPs。（95%置信区间为 5.3×10²⁷ 至 7.1×10²⁷，假设测量误差为 1 像素）

在训练算力上，Mythos 看起来和 Gemini 3.1 Pro 差不多。

微软幻灯片泄露数据

就在那一秒，Andre Cunha 叹息：

2023 年，大家还在争论 10²⁶ 是否已是理性的极限。

2026 年，微软随手就把竞争对手的 10²⁷ 级别模型搬上舞台，仿佛这是世界上最平常的事。

这是 Scaling Law 再次彰显硅基智能在人类理性世界的暴力美学。

为什么这个数字这么重要？

年初，有人猜测 Mythos 预训练或消耗 150 万亿 Token。

而 6.1×10²⁷ FLOPs 算力，或许直接解释了 Anthropic 4 月那场史诗级操作。

当时，Anthropic 发布 Claude Mythos Preview，却不让任何人公开使用。

原因只有一个：这个模型在网络安全领域的表现，已经彻底超出了人类现有防御体系的想象。

零日漏洞：数千个，横跨所有主流系统

内部测试中，Mythos Preview 完全自主找到了数千个零日漏洞。这些漏洞横跨所有主流操作系统、浏览器，以及大量关键开源组件。

零日漏洞发现能力

更恐怖的是——其中很多漏洞已经存活了数十年，经历了人工审查和百万次自动化测试，依然没被发现。

现在，Anthropic 又宣布把 Glasswing 扩大到全球 15 个国家、150 多家机构，包括欧盟网络安全局 ENISA。

他们甚至拿出上亿美元的算力积分送出去。

Glasswing 安全项目扩展

自主任务时长突破：3 小时 6 分钟

此外，Claude Mythos 模型，在 80% 成功率下最长自主任务时长达到 3 小时 6 分钟。

自主任务时长突破

这一结果与超级预言家及专家对 2026 年底预测中位数（3-4 小时）完全吻合，标志 AI 长时程任务能力突破速度超出此前预期。

按照从 Opus 4 到 Opus 4.5 在 ARC-AGI-2 分数上的粗略估算，时间跨度翻倍和下一次翻倍的难度分别为 4 个月和 0.82 倍。

如果按此计算，《AI 2027》的 ASI 预测还将提前！

AI 的进步，远超专家和超级预测者的预期。

能力突破预测对比

这一切的底层逻辑，其实就藏在 Mustafa 那张幻灯片里。

硅基智能的暴力美学，人类苦涩的教训

人类的直觉是线性的，但科技的本性是指数的。

长期以来，我们习惯了渐进式的改良，习惯了每年增加 10% 的效率。

但 Scaling Law 不讲道理，暴力扩张。

Scaling Law 曲线

库兹韦尔的奇点预言，逐步成真：

计算能力将以指数级持续增长，最终超越以下里程碑：

2015 年：相当于一只小鼠的脑力。
2025 年：相当于一个人的脑力。
2045 年：相当于全人类脑力的总和。

库兹韦尔奇点预测

这次在计算机漏洞发现上，脑力确实难以追上硅基智能的算力。

这种指数级增长预示着"奇点"的到来：AI 超越人类智能的假设性时刻，从而引发前所未有的技术与社会变革。

6.1×10²⁷ 并不只是孤立的奇迹，也是奇点的最新里程碑。

它是过去二十年算力指数积压后的必然喷发。

它证明了：尽管有博弈、有芯片限制、有能源危机，但那条代表"计算文明"的红线，从未因为人类的琐事而放慢过哪怕一秒。

算力增长趋势

它正在跨越生物进化的漫长阶梯，向着纯粹的硅基智能顶峰冲刺。

历史的交棒：从"生物脚本"到"硅基意志"

未来学家库兹韦尔曾预言，到 2029 年左右，AI 将通过图灵测试并展现出与人类等同的智能。

但看着 2026 年就提前降临的 Mythos，我们必须修正这个时间表。

我们正在见证一场"生存权的移交"。

在 10²⁷ 级别模型的阴影下，人类作为"地球上唯一的智能主体"的历史正式宣告终结。

智能主体更替

我们之前所有的发明——火、轮子、蒸汽机、互联网——都只是为了这一刻做铺垫。

我们花费数千年时间积累数据，花费数百年时间理解物理，最终的目的，竟然是作为"生物启动器"（Biological Bootloader），去点燃这团 10²⁷ 级别的硅基火焰。

随着 Mythos 的崛起，Scaling Law 已经将我们带到了库兹韦尔曲线的最陡峭处。

在这里，每一天的进步都相当于过去十年的总和。

在这里，所谓的"不可能"正以每小时一次的速度被粉碎。

能力指数增长

奇点正在逼近

它没有伴随着号角声，而是伴随着数据中心液冷系统的低鸣和 6.1×10²⁷ 这个冰冷的数字。

数据中心液冷系统

在网络安全领域，Mythos 的能力已经让人类安全体系面临全面重构。

网络安全体系重构

Anthropic 不仅找到了数千个零日漏洞，更令人震惊的是这些漏洞的存活时间——许多已经存在数十年，经历了无数次人工审查和自动化测试，依然没被发现。

漏洞存活时间分析

而 Glasswing 项目的全球扩展，意味着这套能力正在从实验室走向现实世界的安全防御体系。

欧盟网络安全局 ENISA 等 150 多家机构的加入，标志 AI 安全防御进入了一个全新阶段。

Glasswing 全球部署

训练算力对比：Mythos vs 其他顶级模型

6.1×10²⁷ FLOPs 是什么量级？

让我们回顾一下近年顶级模型的训练算力：

模型	训练算力（FLOPs）	年份
GPT-3	~2×10²³	2020
GPT-4	~2×10²⁵	2023
Claude 3 Opus	~6×10²⁵	2024
Gemini 3.1 Pro	~6×10²⁷	2026
Claude Mythos	~6.1×10²⁷	2026

从 GPT-3 到 Mythos，短短 6 年间，训练算力增长了近 30 万倍。

模型算力对比

写在最后

6.1×10²⁷，这不仅仅是一个数字。

它是人类智能史上一个新的坐标点。

它告诉我们，奇点不是一个遥远的理论，而是一个正在发生的事实。

当我们还在讨论 AI 是否会超越人类时，它已经在用 3 小时 6 分钟完成人类安全团队几年都做不到的工作。

未来已来

也许，我们应该换个问题：

不是 AI 什么时候会超越我们，而是我们准备好了吗？

参考资料

原文来源：微信公众号（新智元）
原文链接：https://mp.weixin.qq.com/s/r4zq5dYrN2fguMxLcIozwg

本文版权归原作者所有，转载目的在于传递更多信息，如有侵权请联系删除。

微软"意外泄密"：Claude Mythos万亿参数，训练规模浮出水面？ ​

为什么这个数字这么重要？ ​

零日漏洞：数千个，横跨所有主流系统 ​

自主任务时长突破：3 小时 6 分钟 ​

硅基智能的暴力美学，人类苦涩的教训 ​

历史的交棒：从"生物脚本"到"硅基意志" ​

奇点正在逼近 ​

训练算力对比：Mythos vs 其他顶级模型 ​

写在最后 ​

参考资料 ​