Skip to content

突发!文本/图片/视频API全部无限期免费,大模型真正的"普惠时刻"来了

来源:微信公众号 | 原文链接:https://mp.weixin.qq.com/s/aMo2yFHVNs7LsRLJmjegEw 版权归原作者所有,如有侵权请联系删除

行业深水炸弹,榜单排名前十的 AI Lab Agnes AI 正式宣布:自 6 月 1 日起,旗下核心的全模态模型(包含文本、图片、视频)API,向全球开发者与创作者无限期免费开放。

官方 API 地址:https://platform.agnes-ai.com/

没有限时、不需要绑定信用卡,目前说的就是无限期。

看到"免费"两个字,第一反应往往是:是不是模型能力不行,拿来做噱头的?本文作者实际实测了一遍,看看真实表现到底怎么样。

文本模型 Agnes-2.0-Flash —— 专为复杂 Agent 而生

Agnes-2.0-Flash 是一款基于新一代 Transformer 架构的多模态基础模型。

在此之前,它的定价是输入 0.03 刀/1M tokens,输出 0.15 刀/1M tokens(这已经是极具性价比的价格,约为 DeepSeek V4 flash 的一半)。现在,直接降到 0。

模型速度极快,核心是 Agent 能力。在专门评测"真实 Agent 场景综合执行能力"的 Claw-Eval 榜单中,Agnes-2.0-Flash 表现不俗。

Agnes-2.0-Flash Agent 能力评测

实测场景 1:大型复杂 PDF 文档翻译

直接扔一个 33 页复杂 PDF 文件翻译,要求翻译为地道中文,排版合理,md 格式。

仅仅 1 分钟就搞定了,这是体验过的最快的翻译速度。

实测场景 2:提示词遵循,前端能力

用弹力球塌方测试前端能力,测试指令遵循、推理和对物理世界的理解。指令遵循全部达成,推理基本达标,满意度 9/10。

弹力球塌方模拟

实测场景 3:搜索、工具调用、可视化

搜索英伟达最新财报进行 HTML 可视化,数据分析和设计表现力都不错。

英伟达财报可视化

实测场景 4:Skill 制作

让它制作一个 Codex Doc Skill,输入关键词即可返回对应的 user case 链接和题目。

作为一个免费的 API,日常任务完全可以切换到 Agnes-2.0-Flash,它的 Agent 能力总体够用,加上闪电般的速度,试错迭代成本无限降低。

图像模型 Agnes-Image-2.0-Flash

基于 Diffusion Transformer 专为"按指令编辑"设计的模型。此前定价 3 刀/100 张,现在彻底无限期免费。

图像编辑能力展示

在 Artificial Analysis (Image Editing Leaderboard) 盲评榜单中名列前茅。

图生图:构图保持与场景重构

提示词:将背景转换为夜晚霓虹闪烁的赛博朋克城市街道,鞋子放在潮湿的柏油路上,带有发光的霓虹灯倒影,完全保持原有的鞋子轮廓和位置不变。

赛博朋克风格迁移

文生图:广告海报

提示词:一张极简玻璃香水瓶的高端商业产品拍摄图,静置在发光的水晶台上。四周环绕着动态漂浮的水花和淡淡的金粉。

香水瓶产品摄影

文生图:信息图

生成 X/Twitter 风格的深色模式个人主页界面,账号为虚构科技创业者。

社交媒体界面生成

跨次元风格迁移

将整个场景转换成可爱的 3D 黏土动画风格,类似皮克斯动画,严格保持原图的建筑布局、窗户位置和家具位置不变。

黏土动画风格迁移

图像模型整体感觉是很多场景足够使用,但距离 GPT Image 2 还有差距,比如扔一个几十页的 PDF 论文让它生成一图流,效果就不太好。未来的方向需要提高文字渲染能力和世界知识。

视频模型 Agnes-Video-V2.0 —— 原生音画同出

在所有模态中,视频 API 是当之无愧的成本刺客。Agnes 的视频 API 之前定价是 $0.3/分钟,现在也加入了无限期免费套餐,支持原生 720P/1080P 输出。

视频生成能力

原生音画同出

视频模型支持原生音画同步输出,包括视觉、语音和音效同时生成。

音画同出示例

电影级第一视角运镜

FPV 无人机视角,平滑穿梭于阳光充沛的茂密松树林中。镜头紧贴树干和树枝掠过,最终展现出一个隐秘的壮丽瀑布。

复杂的树木遮挡关系没有穿模,空间透视极其精准,没有出现常见的空间扭曲畸变。

FPV 视频生成

全模态免费的意义

高质量 AI 不应该只属于高预算公司。

免费开放 API 的背后是一种选择:在赌开发者生态。如果足够多的人用你的模型,搭建在上面的应用和工作流就会成为这个平台最真实的背书。

Agnes AI 全模态免费

Agnes 目前是榜单排名前十的 AI Lab 中极少数同时覆盖文本、图像、视频三大模态,并在这三个模态上分别进入国际评测前列的实验室。这次把三个 API 同时打包免费,是在用一个很明确的动作告诉市场:全模态能力可以不贵。

总结

  • 文本 API(Agnes-2.0-Flash):Agent 能力强,速度快,Claw-Eval 榜单表现优异
  • 图像 API(Agnes-Image-2.0-Flash):编辑能力强,支持多种场景,Artificial Analysis 榜单前列
  • 视频 API(Agnes-Video-V2.0):原生音画同出,720P/1080P 输出,质量稳定

如果你在开发者、内容自动化领域,或者对"一个榜单排名前十的 AI Lab 把全模态 API 开放免费"这件事本身感兴趣,可以直接去试:platform.agnes-ai.com

参考资料


本文版权归原作者所有,转载目的在于传递更多信息,如有侵权请联系删除。