突发！文本/图片/视频API全部无限期免费，大模型真正的"普惠时刻"来了

来源：微信公众号 | 原文链接：https://mp.weixin.qq.com/s/aMo2yFHVNs7LsRLJmjegEw 版权归原作者所有，如有侵权请联系删除

行业深水炸弹，榜单排名前十的 AI Lab Agnes AI 正式宣布：自 6 月 1 日起，旗下核心的全模态模型（包含文本、图片、视频）API，向全球开发者与创作者无限期免费开放。

官方 API 地址：https://platform.agnes-ai.com/

没有限时、不需要绑定信用卡，目前说的就是无限期。

看到"免费"两个字，第一反应往往是：是不是模型能力不行，拿来做噱头的？本文作者实际实测了一遍，看看真实表现到底怎么样。

文本模型 Agnes-2.0-Flash —— 专为复杂 Agent 而生

Agnes-2.0-Flash 是一款基于新一代 Transformer 架构的多模态基础模型。

在此之前，它的定价是输入 0.03 刀/1M tokens，输出 0.15 刀/1M tokens（这已经是极具性价比的价格，约为 DeepSeek V4 flash 的一半）。现在，直接降到 0。

模型速度极快，核心是 Agent 能力。在专门评测"真实 Agent 场景综合执行能力"的 Claw-Eval 榜单中，Agnes-2.0-Flash 表现不俗。

Agnes-2.0-Flash Agent 能力评测

实测场景 1：大型复杂 PDF 文档翻译

直接扔一个 33 页复杂 PDF 文件翻译，要求翻译为地道中文，排版合理，md 格式。

仅仅 1 分钟就搞定了，这是体验过的最快的翻译速度。

实测场景 2：提示词遵循，前端能力

用弹力球塌方测试前端能力，测试指令遵循、推理和对物理世界的理解。指令遵循全部达成，推理基本达标，满意度 9/10。

弹力球塌方模拟

实测场景 3：搜索、工具调用、可视化

搜索英伟达最新财报进行 HTML 可视化，数据分析和设计表现力都不错。

英伟达财报可视化

实测场景 4：Skill 制作

让它制作一个 Codex Doc Skill，输入关键词即可返回对应的 user case 链接和题目。

作为一个免费的 API，日常任务完全可以切换到 Agnes-2.0-Flash，它的 Agent 能力总体够用，加上闪电般的速度，试错迭代成本无限降低。

图像模型 Agnes-Image-2.0-Flash

基于 Diffusion Transformer 专为"按指令编辑"设计的模型。此前定价 3 刀/100 张，现在彻底无限期免费。

图像编辑能力展示

在 Artificial Analysis (Image Editing Leaderboard) 盲评榜单中名列前茅。

图生图：构图保持与场景重构

提示词：将背景转换为夜晚霓虹闪烁的赛博朋克城市街道，鞋子放在潮湿的柏油路上，带有发光的霓虹灯倒影，完全保持原有的鞋子轮廓和位置不变。

赛博朋克风格迁移

文生图：广告海报

提示词：一张极简玻璃香水瓶的高端商业产品拍摄图，静置在发光的水晶台上。四周环绕着动态漂浮的水花和淡淡的金粉。

香水瓶产品摄影

文生图：信息图

生成 X/Twitter 风格的深色模式个人主页界面，账号为虚构科技创业者。

社交媒体界面生成

跨次元风格迁移

将整个场景转换成可爱的 3D 黏土动画风格，类似皮克斯动画，严格保持原图的建筑布局、窗户位置和家具位置不变。

黏土动画风格迁移

图像模型整体感觉是很多场景足够使用，但距离 GPT Image 2 还有差距，比如扔一个几十页的 PDF 论文让它生成一图流，效果就不太好。未来的方向需要提高文字渲染能力和世界知识。

视频模型 Agnes-Video-V2.0 —— 原生音画同出

在所有模态中，视频 API 是当之无愧的成本刺客。Agnes 的视频 API 之前定价是 $0.3/分钟，现在也加入了无限期免费套餐，支持原生 720P/1080P 输出。

视频生成能力

原生音画同出

视频模型支持原生音画同步输出，包括视觉、语音和音效同时生成。

音画同出示例

电影级第一视角运镜

FPV 无人机视角，平滑穿梭于阳光充沛的茂密松树林中。镜头紧贴树干和树枝掠过，最终展现出一个隐秘的壮丽瀑布。

复杂的树木遮挡关系没有穿模，空间透视极其精准，没有出现常见的空间扭曲畸变。

FPV 视频生成

全模态免费的意义

高质量 AI 不应该只属于高预算公司。

免费开放 API 的背后是一种选择：在赌开发者生态。如果足够多的人用你的模型，搭建在上面的应用和工作流就会成为这个平台最真实的背书。

Agnes AI 全模态免费

Agnes 目前是榜单排名前十的 AI Lab 中极少数同时覆盖文本、图像、视频三大模态，并在这三个模态上分别进入国际评测前列的实验室。这次把三个 API 同时打包免费，是在用一个很明确的动作告诉市场：全模态能力可以不贵。

总结

文本 API（Agnes-2.0-Flash）：Agent 能力强，速度快，Claw-Eval 榜单表现优异
图像 API（Agnes-Image-2.0-Flash）：编辑能力强，支持多种场景，Artificial Analysis 榜单前列
视频 API（Agnes-Video-V2.0）：原生音画同出，720P/1080P 输出，质量稳定

如果你在开发者、内容自动化领域，或者对"一个榜单排名前十的 AI Lab 把全模态 API 开放免费"这件事本身感兴趣，可以直接去试：platform.agnes-ai.com

参考资料

原文来源：微信公众号（作者：你说的完全正确/YAR师）
原文链接：https://mp.weixin.qq.com/s/aMo2yFHVNs7LsRLJmjegEw

本文版权归原作者所有，转载目的在于传递更多信息，如有侵权请联系删除。

突发！文本/图片/视频API全部无限期免费，大模型真正的"普惠时刻"来了 ​

文本模型 Agnes-2.0-Flash —— 专为复杂 Agent 而生 ​

实测场景 1：大型复杂 PDF 文档翻译 ​

实测场景 2：提示词遵循，前端能力 ​

实测场景 3：搜索、工具调用、可视化 ​

实测场景 4：Skill 制作 ​

图像模型 Agnes-Image-2.0-Flash ​

图生图：构图保持与场景重构 ​

文生图：广告海报 ​

文生图：信息图 ​

跨次元风格迁移 ​

视频模型 Agnes-Video-V2.0 —— 原生音画同出 ​

原生音画同出 ​

电影级第一视角运镜 ​

全模态免费的意义 ​

总结 ​

参考资料 ​