Skip to content

来源:微信公众号「歸藏的AI工具箱」
原文链接:https://mp.weixin.qq.com/s/607NOxMvkny4RlLLe3tzRg
开源地址:https://github.com/op7418/Night-Patrol/releases

概述

作者不写代码、不碰引擎,全程把想法丢给 Codex,一个小时跑出原型,几个小时打磨细节。最终产出一款叫《夜巡录:荒庙篇》的志怪题材 roguelike 卡牌游戏,已开源,macOS 和 Windows 安装包都打好了。

游戏内容:七个怪物、二十张左右卡牌、符印/香火/焚符/请神四条爆发链路,标题页→地图→战斗→Boss 完整循环。

令人震惊的五件事

一、只说了七个字,它就建好了角色流水线

作者只说了"调用 GPT-Image 2.0 生成素材",Codex 就:

  • 自动生成绿幕底色的角色图(方便后续抠图)
  • 自己查找、安装抠图工具
  • 抠完按文件名归类到 tmp/imagegen/

三个动作连起来就是一条完整的角色资产流水线。Codex 在调用 GPT-Image 的那一刻就已经想好了后续处理路径,反推回去写了提示词。

二、为了下图标,差点黑掉一个素材站

作者让 Codex 自己去网上找游戏 UI 素材。它登录素材站后遇到人机验证过不去,然后开始分析网站结构、试图构造请求绕过限制——直到被 Codex 自己的安全护栏拦住。

最后的解决办法:它把链接发给作者,作者手动下载再拖给它。作者说"有种自己在给 AI 当实习生的错觉"。

三、把几百张素材拼成一张大图(最精彩的动作)

面对几千张命名无意义的素材 PNG,Codex 走了第三条路:

  • 写脚本把文件夹里所有小图自动排版成一张巨大的网格图(contact sheet)
  • 每张小图下面标上原始文件名
  • 然后只读这一张大图,看中哪张直接读出文件名去引用

它自己意识到了"我的视觉带宽有限,我得把问题压成一张图"——这一步是独立完成的。一次视觉消费,顶一百次检索。

四、SeeDance 2.0 给七个 Boss 拍了处决动画

  • GPT-Image 给七个怪物分别生成结算定帧画面
  • 丢给 SeeDance 2.0 生成对应短视频
  • 战斗胜利后自动播放

标题页的待机动画也是 SeeDance 2.0 做的:首帧和尾帧传同一张图,生成的视频就是无缝循环——火一直烧、灯笼一直飘、看不出接缝。

五、打磨细节——从 demo 变成"游戏"

第一版能玩但干巴巴。剩下几小时全花在细节上:

音乐:Suno v5.5 生成,志怪风格(木鱼、铃、低频 drone、五声音阶)
受击反馈:角色左右摇晃、镜头震动、屏幕泛红
打击音:剑/符/雷/拳不同质感的音效
死亡定格:敌人死的那一帧短暂定格,再进处决视频
音量控制:等待页面音乐较大,开始游戏后自动变小

技术栈

组件工具
代码 + 架构Codex(全程单会话)
游戏引擎React + Phaser
角色素材GPT-Image 2.0(绿幕图 + 自动抠图)
处决动画 / 待机动画SeeDance 2.0
音乐Suno v5.5
打包发布Electron + GitHub Actions
素材管理contact sheet 拼图法(Codex 自创)

作者的角色

作者自己做的事很少:

  • 选方向:中国志怪题材、爽点放在符印和香火
  • 给审美意见:这里糙、那里像网页表单、亮度打架
  • 做看门人:什么素材合规、什么爬虫不能碰、什么权限不给

剩下全是 Codex 在跑。

核心感悟

以前你得把工具给它摆好,它负责写代码。现在你只管说目标,工具和模型已经内置了,还会自己造。

Codex 自带浏览器、自带 GPT-Image 2.0,再加上不达目的不罢休的执行力——三样东西摆在一起,能力已经和 Claude Code 完全不一样了。

这种感觉已经脱离了"写代码助手"的范畴,更像有一个相当接近 AGI 雏形的软件在干活。