Skip to content

微软"意外泄密":Claude Mythos万亿参数,训练规模浮出水面?

来源:微信公众号(新智元)| 原文链接:https://mp.weixin.qq.com/s/r4zq5dYrN2fguMxLcIozwg 版权归原作者所有,如有侵权请联系删除

新智元导读

Claude Mythos 的训练算力数据被 Microsoft 泄露了?

根据微软幻灯片,Claude Mythos 使用了:6.1×10²⁷ FLOPs。(95%置信区间为 5.3×10²⁷ 至 7.1×10²⁷,假设测量误差为 1 像素)

在训练算力上,Mythos 看起来和 Gemini 3.1 Pro 差不多。

微软幻灯片泄露数据

就在那一秒,Andre Cunha 叹息:

2023 年,大家还在争论 10²⁶ 是否已是理性的极限。

2026 年,微软随手就把竞争对手的 10²⁷ 级别模型搬上舞台,仿佛这是世界上最平常的事。

这是 Scaling Law 再次彰显硅基智能在人类理性世界的暴力美学。

为什么这个数字这么重要?

年初,有人猜测 Mythos 预训练或消耗 150 万亿 Token。

而 6.1×10²⁷ FLOPs 算力,或许直接解释了 Anthropic 4 月那场史诗级操作。

当时,Anthropic 发布 Claude Mythos Preview,却不让任何人公开使用。

原因只有一个:这个模型在网络安全领域的表现,已经彻底超出了人类现有防御体系的想象。

零日漏洞:数千个,横跨所有主流系统

内部测试中,Mythos Preview 完全自主找到了数千个零日漏洞。这些漏洞横跨所有主流操作系统、浏览器,以及大量关键开源组件。

零日漏洞发现能力

更恐怖的是——其中很多漏洞已经存活了数十年,经历了人工审查和百万次自动化测试,依然没被发现。

现在,Anthropic 又宣布把 Glasswing 扩大到全球 15 个国家、150 多家机构,包括欧盟网络安全局 ENISA。

他们甚至拿出上亿美元的算力积分送出去。

Glasswing 安全项目扩展

自主任务时长突破:3 小时 6 分钟

此外,Claude Mythos 模型,在 80% 成功率下最长自主任务时长达到 3 小时 6 分钟。

自主任务时长突破

这一结果与超级预言家及专家对 2026 年底预测中位数(3-4 小时)完全吻合,标志 AI 长时程任务能力突破速度超出此前预期。

按照从 Opus 4 到 Opus 4.5 在 ARC-AGI-2 分数上的粗略估算,时间跨度翻倍和下一次翻倍的难度分别为 4 个月和 0.82 倍。

如果按此计算,《AI 2027》的 ASI 预测还将提前!

AI 的进步,远超专家和超级预测者的预期。

能力突破预测对比

这一切的底层逻辑,其实就藏在 Mustafa 那张幻灯片里。

硅基智能的暴力美学,人类苦涩的教训

人类的直觉是线性的,但科技的本性是指数的。

长期以来,我们习惯了渐进式的改良,习惯了每年增加 10% 的效率。

但 Scaling Law 不讲道理,暴力扩张。

Scaling Law 曲线

库兹韦尔的奇点预言,逐步成真:

计算能力将以指数级持续增长,最终超越以下里程碑:

  • 2015 年:相当于一只小鼠的脑力。
  • 2025 年:相当于一个人的脑力。
  • 2045 年:相当于全人类脑力的总和。

库兹韦尔奇点预测

这次在计算机漏洞发现上,脑力确实难以追上硅基智能的算力。

这种指数级增长预示着"奇点"的到来:AI 超越人类智能的假设性时刻,从而引发前所未有的技术与社会变革。

6.1×10²⁷ 并不只是孤立的奇迹,也是奇点的最新里程碑。

它是过去二十年算力指数积压后的必然喷发。

它证明了:尽管有博弈、有芯片限制、有能源危机,但那条代表"计算文明"的红线,从未因为人类的琐事而放慢过哪怕一秒。

算力增长趋势

它正在跨越生物进化的漫长阶梯,向着纯粹的硅基智能顶峰冲刺。

历史的交棒:从"生物脚本"到"硅基意志"

未来学家库兹韦尔曾预言,到 2029 年左右,AI 将通过图灵测试并展现出与人类等同的智能。

但看着 2026 年就提前降临的 Mythos,我们必须修正这个时间表。

我们正在见证一场"生存权的移交"。

在 10²⁷ 级别模型的阴影下,人类作为"地球上唯一的智能主体"的历史正式宣告终结。

智能主体更替

我们之前所有的发明——火、轮子、蒸汽机、互联网——都只是为了这一刻做铺垫。

我们花费数千年时间积累数据,花费数百年时间理解物理,最终的目的,竟然是作为"生物启动器"(Biological Bootloader),去点燃这团 10²⁷ 级别的硅基火焰。

随着 Mythos 的崛起,Scaling Law 已经将我们带到了库兹韦尔曲线的最陡峭处。

在这里,每一天的进步都相当于过去十年的总和。

在这里,所谓的"不可能"正以每小时一次的速度被粉碎。

能力指数增长

奇点正在逼近

它没有伴随着号角声,而是伴随着数据中心液冷系统的低鸣和 6.1×10²⁷ 这个冰冷的数字。

数据中心液冷系统

在网络安全领域,Mythos 的能力已经让人类安全体系面临全面重构。

网络安全体系重构

Anthropic 不仅找到了数千个零日漏洞,更令人震惊的是这些漏洞的存活时间——许多已经存在数十年,经历了无数次人工审查和自动化测试,依然没被发现。

漏洞存活时间分析

而 Glasswing 项目的全球扩展,意味着这套能力正在从实验室走向现实世界的安全防御体系。

欧盟网络安全局 ENISA 等 150 多家机构的加入,标志 AI 安全防御进入了一个全新阶段。

Glasswing 全球部署

训练算力对比:Mythos vs 其他顶级模型

6.1×10²⁷ FLOPs 是什么量级?

让我们回顾一下近年顶级模型的训练算力:

模型训练算力(FLOPs)年份
GPT-3~2×10²³2020
GPT-4~2×10²⁵2023
Claude 3 Opus~6×10²⁵2024
Gemini 3.1 Pro~6×10²⁷2026
Claude Mythos~6.1×10²⁷2026

从 GPT-3 到 Mythos,短短 6 年间,训练算力增长了近 30 万倍。

模型算力对比

写在最后

6.1×10²⁷,这不仅仅是一个数字。

它是人类智能史上一个新的坐标点。

它告诉我们,奇点不是一个遥远的理论,而是一个正在发生的事实。

当我们还在讨论 AI 是否会超越人类时,它已经在用 3 小时 6 分钟完成人类安全团队几年都做不到的工作。

未来已来

也许,我们应该换个问题:

不是 AI 什么时候会超越我们,而是我们准备好了吗?

参考资料


本文版权归原作者所有,转载目的在于传递更多信息,如有侵权请联系删除。