一个下午用Codex做了一款志怪Roguelike卡牌游戏《夜巡录》

来源：微信公众号「歸藏的AI工具箱」
原文链接：https://mp.weixin.qq.com/s/607NOxMvkny4RlLLe3tzRg
开源地址：https://github.com/op7418/Night-Patrol/releases

概述

作者不写代码、不碰引擎，全程把想法丢给 Codex，一个小时跑出原型，几个小时打磨细节。最终产出一款叫《夜巡录：荒庙篇》的志怪题材 roguelike 卡牌游戏，已开源，macOS 和 Windows 安装包都打好了。

游戏内容：七个怪物、二十张左右卡牌、符印/香火/焚符/请神四条爆发链路，标题页→地图→战斗→Boss 完整循环。

令人震惊的五件事

一、只说了七个字，它就建好了角色流水线

作者只说了"调用 GPT-Image 2.0 生成素材"，Codex 就：

自动生成绿幕底色的角色图（方便后续抠图）
自己查找、安装抠图工具
抠完按文件名归类到 tmp/imagegen/

三个动作连起来就是一条完整的角色资产流水线。Codex 在调用 GPT-Image 的那一刻就已经想好了后续处理路径，反推回去写了提示词。

二、为了下图标，差点黑掉一个素材站

作者让 Codex 自己去网上找游戏 UI 素材。它登录素材站后遇到人机验证过不去，然后开始分析网站结构、试图构造请求绕过限制——直到被 Codex 自己的安全护栏拦住。

最后的解决办法：它把链接发给作者，作者手动下载再拖给它。作者说"有种自己在给 AI 当实习生的错觉"。

三、把几百张素材拼成一张大图（最精彩的动作）

面对几千张命名无意义的素材 PNG，Codex 走了第三条路：

写脚本把文件夹里所有小图自动排版成一张巨大的网格图（contact sheet）
每张小图下面标上原始文件名
然后只读这一张大图，看中哪张直接读出文件名去引用

它自己意识到了"我的视觉带宽有限，我得把问题压成一张图"——这一步是独立完成的。一次视觉消费，顶一百次检索。

四、SeeDance 2.0 给七个 Boss 拍了处决动画

GPT-Image 给七个怪物分别生成结算定帧画面
丢给 SeeDance 2.0 生成对应短视频
战斗胜利后自动播放

标题页的待机动画也是 SeeDance 2.0 做的：首帧和尾帧传同一张图，生成的视频就是无缝循环——火一直烧、灯笼一直飘、看不出接缝。

五、打磨细节——从 demo 变成"游戏"

第一版能玩但干巴巴。剩下几小时全花在细节上：

音乐：Suno v5.5 生成，志怪风格（木鱼、铃、低频 drone、五声音阶）
受击反馈：角色左右摇晃、镜头震动、屏幕泛红
打击音：剑/符/雷/拳不同质感的音效
死亡定格：敌人死的那一帧短暂定格，再进处决视频
音量控制：等待页面音乐较大，开始游戏后自动变小

技术栈

组件	工具
代码 + 架构	Codex（全程单会话）
游戏引擎	React + Phaser
角色素材	GPT-Image 2.0（绿幕图 + 自动抠图）
处决动画 / 待机动画	SeeDance 2.0
音乐	Suno v5.5
打包发布	Electron + GitHub Actions
素材管理	contact sheet 拼图法（Codex 自创）

作者的角色

作者自己做的事很少：

选方向：中国志怪题材、爽点放在符印和香火
给审美意见：这里糙、那里像网页表单、亮度打架
做看门人：什么素材合规、什么爬虫不能碰、什么权限不给

剩下全是 Codex 在跑。

核心感悟

以前你得把工具给它摆好，它负责写代码。现在你只管说目标，工具和模型已经内置了，还会自己造。

Codex 自带浏览器、自带 GPT-Image 2.0，再加上不达目的不罢休的执行力——三样东西摆在一起，能力已经和 Claude Code 完全不一样了。

这种感觉已经脱离了"写代码助手"的范畴，更像有一个相当接近 AGI 雏形的软件在干活。

概述 ​

令人震惊的五件事 ​

一、只说了七个字，它就建好了角色流水线 ​

二、为了下图标，差点黑掉一个素材站 ​

三、把几百张素材拼成一张大图（最精彩的动作） ​

四、SeeDance 2.0 给七个 Boss 拍了处决动画 ​

五、打磨细节——从 demo 变成"游戏" ​

技术栈 ​

作者的角色 ​

核心感悟 ​

概述