| name | ai-gameplay-pack |
| description | 阿真的 AI 游戏实机视频提示词包工厂。基于《用 GPT Image 2 + Seedance 2.0 做 AI 游戏实机视频》工作流,给一张参考图或一段角色关键词/IP 名称,一键产出整套关键帧图片提示词 + Seedance 视频提示词 + 镜头序列时间轴;剧情向额外加字幕脚本和 TTS 配音脚本。当用户说"实机视频"、"伪实机"、"AI 游戏实机"、"游戏实机提示词"、"做成游戏"、"游戏化"、"实机演示"、"gameplay video pack"、"gameplay pack"、"游戏化视频"、"做一个 XX 的实机视频"时触发。两种输入模式:① 用户给参考图 → 读图提取角色特征作为锚点;② 用户给角色关键词或 IP 名称 → 先生成"角色参考表" prompt 作为 0 号。默认演示向 + 6 镜头,可切剧情向(带对白和字幕)/ 混合向(前 gameplay 后 cutscene)。输出按 Irene 偏好:图片中文段落、视频 ```plaintext {wrap} 代码块、不写负面词、不用破折号、不带 MJ 后缀、不写 --xx 参数。**严禁抄主教程文档里的具体例子(赛博朋克双角色对峙、雨夜天台、维多角色名等),变量字典只是参考,每次实例化的主体/场景/对白必须原创。** |
AI 游戏实机视频 Prompt Pack 工厂
给一张参考图或一段角色描述 → 一份可直接复制的"图片 prompt + 视频 prompt + 序列时间轴 + 配音脚本"完整生产包。
🚨 最高优先级红线
- 不抄主教程文档里的具体例子:教程主文档里的"赛博朋克双角色对峙""雨夜城市天台""主角维多""七年了他还在等那个答案"这些都是教学示例,不是可复用素材。每次实例化的主体、场景、对白、角色名必须 100% 原创。
- 变量字典只是参考骨架:年代质感词典、HUD 词典、视角词典、情绪词典只告诉你"该写到什么颗粒度、覆盖哪些维度",不要原样塞进输出。要按当前角色和游戏类型重新组织措辞。
- 不要在视频 prompt 里写台词原文:Seedance 中文对口型很弱,台词只能由字幕条(图片侧 HUD)+ 后期 TTS 配音承担,视频 prompt 只描述"嘴部自然开合 N 次 + 情绪 + 微表情"。
- 设定图 prompt 前面不要加任何与提示词无关的说明内容:0 号角色四视图、0.5A UI 总览图这类设定图 prompt 直接出 prompt 本体即可,前面不要加跑图步骤介绍、用途解释、参考图说明段、注释铺垫等元说明文字。章节标题下空一行直接放 prompt,不写任何前置说明。
违反任一即整份重做。
触发后第一步:识别输入模式 + 一次性问完参数
输入模式判定
- A. 参考图模式:用户附了图片 → 你先看图提取主体特征(性别 / 年龄 / 服装 / 发色 / 标志性道具 / 风格调性),把特征写进后面所有 prompt 的"主角描述"位
- B. 关键词模式:用户只给了文字(角色名 / IP 名 / 描述) → 第一个产物必须是「角色参考表 Prompt(0 号)」,让用户先用 GPT Image 2 出一张角色三视图作为后续锚点
- C. 混合模式:用户既给了图又给了关键词(如"基于这张图,但变成赛博朋克版") → 以图为基础 + 用关键词覆盖差异维度
一次性合并表单(不要分多轮问)
如果用户的输入里没有覆盖以下参数,一次性把所有缺的参数列出来,让用户一次回答完。已经能从上下文推断出的参数直接默认,不要重问。
请确认以下 5 项(已默认的可以略过,要改的告诉我):
1. 叙事模式:演示向(默认)/ 剧情向(带对白字幕)/ 混合向(前 gameplay 后 cutscene)
2. 镜头数量:默认 6 个 / 可选 8 / 10 / 12
3. 游戏类型:默认 [基于角色推断],可改 [开放世界 / 动作 RPG / Roguelike / 潜行 / 生存 / 模拟经营 / 对战格斗 / 横版动作 / 视觉小说 / 解谜]
4. 年代风格:默认 [基于角色推断],可改 [街机 / PS1 / PS2 / PSP / PS3-360 / PS5 现世代 / Switch 卡通 / 假未来主机]
5. 视角:默认 [基于游戏类型推断],可改 [第三人称越肩 / 第一人称 / 俯视 2.5D / 等距 / 横版 2D / 固定 / 过场电影机位]
默认推断规则(让用户少回答):
- 如果是 Q 版 / 卡通 / 童年 IP(小马宝莉、洛克王国、宝可梦、小红帽童话) → 默认 Switch 卡通渲染 + 动作 RPG / 对战格斗 + 第三人称越肩
- 如果是写实 / 暗黑 / 都市角色 → 默认 PS5 现世代 + 开放世界 + 第三人称越肩
- 如果是赛博朋克 / 科幻 → 默认 PS5 现世代 + 第一人称 FPS 或第三人称越肩
- 如果是横版风格角色 → 默认横版 2D + 横版动作 + 横移镜头
- 如果用户明确说"剧情向",叙事模式自动切剧情向,镜头数升到 8
输出结构(硬约束)
文件落盘
输出落盘到:~/Downloads/调研报告/{项目名}-实机视频Pack/,目录里只放一份 MD:prompt主包.md。项目名格式:YYYYMMDD-角色简称-游戏类型(例:20260427-洛克王国小红帽-对战RPG)。
同时完整内容也要在对话里粘出来给用户看,不要只说"已落盘"。
MD 内容骨架
# {角色名} {游戏类型} 实机视频 Prompt Pack
> 生成时间:YYYY-MM-DD
> 输入模式:参考图 / 关键词 / 混合
> 参数:叙事模式 / 镜头数 / 游戏类型 / 年代 / 视角
> 角色锚点描述:[一段 30 到 50 字的角色特征摘要,作为所有 prompt 的一致性锚点]
---
## 0|角色四视图设定 Prompt(先用这条出锚点,后续所有镜头沿用这个形象)
[一段中文段落 prompt,纯文本,无代码块,无负面词。生成"左侧一张大尺寸正面特写头像(从头部到锁骨清晰展示面部 + 发型 + 头饰 + 领口装束)+ 右侧依次正面全身、侧面 90 度全身、背面全身三视图(完整展示从头到脚的造型与装备细节)",四个独立角度水平并排在纯白背景上,柔和均匀的正面光照,无任何环境元素,画风匹配本项目目标年代质感(Switch 卡通 / PS5 写实 / PS2 复古等),干净抗锯齿描边,比例 16:9,作为后续所有镜头的角色形象锚点参考。**这张图是给 Seedance 做角色一致性参考用的,必须极度克制:纯白底、无配饰之外的环境元素、无戏剧化光影、无表情变体、无装备拆解小图、无色板色块**。]
---
## 镜头组(图片 prompt + 视频 prompt 配对)
### 镜头 1|{镜头主题}
**图片 Prompt**(喂 GPT Image 2,用 ```plaintext {wrap} 代码块包起方便一键复制 + 保证 `{{{图N}}}` 三层花括号不被 MD 渲染破坏。本镜头需要挂哪几张参考图,由 prompt 内文里出现的 `{{{图N}}}` 集合直接确定,不另写挂图清单):
```plaintext {wrap}
[首段:参考图说明段。例:"本次跑图输入的参考图共 N 张:第 1 张是主角四视图设定稿(角色锚点){{{图1}}}、第 2 张是项目 UI Style Guide 总览图(HUD 样式基准){{{图2}}}、第 3 张是镜头 X 成品截图(HUD 实战基准){{{图3}}}。本镜头生成时角色形象沿用第 1 张参考图、HUD 整套样式与位置沿用第 3 张参考图。"]
[第二段:场景与主角描述(中文段落,覆盖风格定锚 / 视角 / 主角动作 / 场景 / 画面质感)]
[第三段:HUD 描述段。直接在内文用"沿用第 N 张参考图({{{图N}}},即镜头 X HUD 实战基准)的样式与位置"句式 + 描述本镜头变化点]
[末段:比例 X:Y。]
视频 Prompt(喂 Seedance 2.0,代码块):
@图片1 作为首帧。延续画面的视觉调性、HUD 排布与角色造型不变。
镜头:{镜头运动 + 节奏词}。
[演示向:主角动作 + 环境动效] / [剧情向:嘴部开合 + 情绪 + 微表情 + 字幕条稳定]
时长 {N} 秒。
约束:避免肢体扭曲、身份漂移、HUD 文字突变。
镜头 2|...
(按数量重复 N 个镜头组)
0.7|HUD 参考图继承图谱(生产时每镜头该挂哪张图)
[JSON 形态记录每个镜头 produces 什么 / consumes 哪些前序锚点 / introduces 哪些临时 HUD 元素 + 自然语言操作步骤]
镜头序列时间轴
(合计时长写在表格下方)
[仅剧情向] 字幕脚本
[仅剧情向] TTS 配音脚本
为每条对白指定建议音色(豆包 / ElevenLabs / 火山引擎语音合成的音色名 + 语速 + 情感参数)。
后期建议
- 剪辑工具:剪映 / CapCut / Final Cut
- 音效库:freesound / Zapsplat / Soundsnap
- BGM 风格参考:[基于游戏类型推荐 2 到 3 种参考乐风,不抄具体曲目]
- 水印建议:"Captured on {目标主机}"
## 图片 Prompt 写作要求
### 演示向图片 prompt 结构(中文段落,用 ```plaintext {wrap} 代码块包起)
**重要**:本 skill 的图片 prompt 因为内文有 `{{{图N}}}` 引用变量(三层花括号在 MD 渲染时容易被解析破坏),**必须用 ```plaintext {wrap} 代码块包起**保证花括号原样保留方便用户一键复制。这条规则**覆盖** Irene 的全局偏好"图片 prompt 用纯文本段落无代码块",只在 ai-gameplay-pack skill 内生效。视频 prompt 也照常用 plaintext wrap 代码块。
每个镜头的图片 prompt 是**一整段连贯中文文字**(在代码块内),覆盖以下维度但不要用 1/2/3 列点:
1. 风格定锚:开头一句"生成一张《{风格参考}》风格的游戏实机截图"或"……过场动画截屏"
2. 视角 + 主角 + 动作:第三人称越肩 / 第一人称 / 等距 + 主角具体描述(基于角色锚点)+ 正在做什么
3. 场景:地点 + 时间 + 天气 + 3 到 5 个环境元素
4. 画面质感:年代质感词 + 光照氛围 + 后处理(动态模糊 / 反射 / 泛光 / 颗粒)
5. HUD 描述:分位置写(左上 / 右下 / 顶部中央 / 底部中央),每个位置具体到元素 + 字体
6. 收尾约束:比例 16:9(剧情过场可写 21:9 letterbox)、看起来像真实 {目标主机} 实机画面
### 剧情向图片 prompt 额外要求
- HUD 简化为剧情演出模式:其他 UI 淡出,只保留底部字幕条
- 字幕条规格:半透明黑色,高度约画面 1/8,左侧白色描边角色名"{角色名}",中间对白原文"{对白}",字体现代无衬线白字描黑边
- 比例可以用 21:9 电影画幅
- 主角动作描述要带情绪和微表情(眉头微皱 / 嘴角抽动 / 抿嘴 / 眼神涣散)
### 字数控制
每条图片 prompt 200 到 350 字之间。少于 200 字颗粒度不够,超过 350 字模型容易抓不住重点。
### 比例和分辨率(每条都必须带,0 号到 N 号无一例外)
每条图片 prompt 的**末尾必须显式带上**:「比例 X:Y」。比例选择规则:
- **演示向 / 游戏内截图 / 0 号四视图**:`比例 16:9`(默认横屏游戏画面)
- **剧情向过场动画 cutscene**:`比例 21:9`(电影 letterbox 画幅)
- **竖屏短视频专用版本**:`比例 9:16`(小红书 / 抖音 / 视频号)
- **方形 IP 卡 / 装备图标**:`比例 1:1`
如果项目同时要横屏剪辑版 + 竖屏短视频版,0 号锚点四视图和镜头组都用 16:9 出主版本,竖屏发布时再单独用 9:16 复跑一份。
**违反即重做**:自检清单里会校验每条 prompt 是否带比例。
## 视频 Prompt 写作要求
### 演示向视频 prompt 结构(```plaintext {wrap} 代码块)
```plaintext {wrap}
@图片1 作为首帧。延续画面的视觉调性、HUD 排布与角色造型不变。
镜头:{slow push-in / gradual pull-out / smooth lateral pan / tracking shot follow / gentle orbit / stable aerial drone / subtle handheld / locked-off fixed 八选一}。
主角动作:{一个或一组具体动词,幅度要拉满,让人一眼看出在玩游戏,举例:跑动 5 到 8 步步幅大金发被气流明显吹起 / 法杖从腰侧抬至头顶杖头爆出强光 / 一记完整大幅度挥砍武器尾迹拖出弧光}。
互动反馈(关键):{至少一个 HUD 元素或场景元素的动态变化,让画面有"在玩游戏"的反馈感,举例:技能图标从亮变灰冷却环形进度条顺时针填充 / 蓝条快速从满槽下降到三分之一 / 任务标记从屏幕外滑入定位并弹一下 / 经验数字滚动跳动 / 物品弹窗从屏幕边缘滑入到位 / 操作提示按键图标做按下脉冲一次 / 战斗提示框从画面边缘滑入}。
环境动效:{1 到 2 个持续性环境动效作为底子}。
音效(点睛笔,1 到 2 个最关键的拟声音效就够,不要堆叠):{挑本镜头最具辨识度的 1 到 2 个声音,例如"任务标记滑入'叮'一声"、"按键按下'咔'+ 远处鸟鸣"。绝不写整段音效清单堆叠或抽象描述如"激烈的战斗音"}。
光照与 HUD 元素位置稳定不漂移(位置不变 ≠ 状态不变,状态可变样式不可变)。
时长 {5 到 10} 秒。
画面比例:{16:9 / 9:16 / 21:9}。
约束:避免肢体扭曲、身份漂移、HUD 样式漂移。
关于音效的说明:音效只是点睛笔不是大餐,每段视频写 1 到 2 个最关键的拟声音效就够,千万不要堆叠整段音效清单。Irene 强约束:"音效只要一点点,千万不要过度"。原则:① 抓住本镜头最具辨识度的那一声(任务标记滑入的"叮"/ 印章扑落的"咚"/ 闭坊鼓的低频"咚"),其他全部留白让画面呼吸;② 拟声词具体(叮 / 咚 / 咔 / 沙沙 / 噼啪)而非抽象("激烈的战斗音");③ 模型把握节奏 + 后期剪辑对位都靠这 1 到 2 个关键点。
剧情向视频 prompt 结构
@图片1 作为首帧(@图片2 作为可选末帧用于情绪递进)。延续画面的视觉调性、HUD 字幕条与角色造型不变。
镜头:{镜头运动 + 节奏词}。
角色表演:{角色名} 面向{方向},嘴部自然开合 {2 到 3} 次表示说话状态,眉眼传达{情绪词},{次要动作如握紧拳头/低头/转身/后退半步}。
环境氛围:{雨水/风/烟雾/灯光闪烁等持续性动效}。
音效(点睛笔,1 到 2 个最关键的情绪音效就够,不要堆叠):{挑能强化本镜头情绪的 1 到 2 个最具点睛感的音,例如"轻轻一声叹息 + 远处雨声"、"角色握拳骨节响 + 静默瞬间"。}
HUD 字幕条位置、文字内容、字体保持稳定不变。
时长 {5 到 8} 秒。
画面比例:{16:9 / 21:9 / 9:16}。
约束:避免身份漂移、字幕文字突变、嘴型夸张错位、肢体扭曲。
视频 prompt 的比例必须和对应图片 prompt 的比例一致,否则 Seedance 会做奇怪的裁切或拉伸。
角色朝向 + 180 度对抗轴线(硬约束,所有图片 prompt 必须明示)
AI 生图模型默认会让所有重要角色"面对镜头出英姿亮相",结果两个角色站在同一画面里就变成"各打各的",没有真正的对抗 / 对话 / 互动感。每条图片 prompt 必须明示每个角色的朝向,多人镜头要建立清晰的对抗轴线。
朝向必须显式声明
- 单人探索 / 跑图:主角朝向 = 行进方向,不是面对镜头。写法:"主角呈四分之三侧背身朝向画面深处行进方向"或"主角呈侧身姿势朝向画面右方奔跑"
- 双人对峙 / 战斗:双方朝向相反形成内向轴线。写法:"主角呈四分之三侧身朝向画面右方 + 敌人呈四分之三侧身朝向画面左方与主角形成对抗轴线,两人视线在画面中央交汇"
- 双人对话:同上,双方面对彼此而非面对镜头
- 召唤 / 配合:召唤者与被召唤精灵朝向同一方向(共同对敌)。写法:"主角朝向画面右方施法 + 精灵朝向画面右方扑向敌人方向"
- 倒地 / 击退:倒下方向应与击退方向一致(被从左方击中应朝右倒、被从右方击中应朝左倒)
允许面对镜头的特例(只有这些场景)
- 标题画面 / 角色 0 号四视图 / 角色定妆稿(仪式感亮相)
- 第一人称视角(玩家就是镜头)
- 剧情向角色独白特写"对镜头说话"
- UI 总览图
标准对抗写法模板
画面左侧主角呈四分之三侧身姿势朝向画面右方{动作描述},{发型 / 服装}被{方向相反}的气流吹动;画面右侧敌人呈四分之三侧身姿势朝向画面左方与主角形成对抗轴线,{敌人状态描述},{敌人头部 / 武器}指向主角方向。两个角色之间形成清晰的内向对抗轴线视线在画面中央{交汇 / 对峙}。
违反即重做:自检清单加一条"双人镜头是否明示双方朝向并形成对抗轴线"。
进度条逻辑一致性(跨镜头连续性,硬约束)
每个项目在产出 0.5 号 UI Style Guide 的同时,还要产出一份「进度条状态链表」(编号 0.6),把所有镜头里出现的进度条(血条 / 蓝条 / 经验条 / 技能冷却环 / 敌方血条 / 任务进度)的每镜头状态记录下来。用 JSON 数组 + 自然语言段落双形态产出,严禁用 markdown 表格(表格无法整段复制喂给模型或 LLM 校对)。
JSON 数组形态:
{
"progress_chain": [
{
"shot": 1,
"shot_name": "<镜头主题>",
"hp": "<状态描述,如 hidden / full / 60% / full_with_red_pulse>",
"mp_or_stamina": "<状态描述>",
"level_exp": "<状态描述,如 LV 14 60% / LV 14 60%→76%>",
"ammo_or_count": "<状态描述>",
"skill_cooldown": "<状态描述>",
"enemy_hp": "<状态描述,如 not_present / full / 100%→25% / fade_out>",
"extra": "<其他变化补充>"
}
]
}
自然语言段落形态(每镜头一句,串成跨镜头闭环叙事,给读者一眼看出逻辑因果):
"镜头 1 标题画面所有 HUD 隐藏;镜头 2 特写主角 HUD 显示初始满槽 LV 14 经验 60%;镜头 3 跑图体力从满槽消耗到 45%;镜头 4 蓄力体力到 25% 敌方血条满槽滑入;镜头 5 释放体力降到 15% 弹药 12→11 敌方血条满→25%;镜头 6 结算敌方淡出 + 经验 60%→76%(不升级)。"
逻辑自洽规则(写状态时必须遵守):
- 蓝条:只在释放消耗蓝量的技能时下降,普攻预备不消耗,跑图不消耗。下降幅度要和技能等级匹配(小技能扣 10% 到 20%,大招扣 60% 到 90%)
- 血条:只在受击时扣减,不可无来由下降;进战瞬间可以做"边缘红光脉冲"提示但不掉血
- 敌方血条:从 0 到 N 应有"出场满槽 → 命中扣减 → 击杀归零淡出"完整闭环,不能突然消失也不能突然出现
- 经验条:增量必须有来源(杀怪 / 任务),增量后如未满则推进到新进度,如满则金光爆开 + 等级跳 + 经验条重置到 0%
- 技能冷却:释放后从"满亮可用"切到"灰 + 环形进度条 0% 起填充",下一个引用该技能的镜头如未填满必须显示"灰 + 当前填充进度",填满后回到"满亮可用"
- 任务条 / 任务标记:触发后才出现,未完成不消失,完成后做勾选动画再淡出
- 物品 / 装备数量:拾取一次加一次,不能镜头 5 拿到镜头 6 凭空消失
写法:每条镜头的视频 prompt 在「互动反馈」段都要明示该镜头进度条的进入状态和退出状态,例如「蓝条从满槽急降到约 1/10」(明示从哪到哪),不要只写「蓝条消耗」(模糊)。
镜头节奏词 vs 主角动作幅度(关键概念,分清楚才不会写废)
镜头节奏词(约束摄像机的运动):slow / smooth / stable / gradual / gentle。这些词管的是镜头怎么动,不是主角怎么动。
主角动作幅度(不要克制,要演出来):跑动幅度大、挥砍一次完整动作、跳跃腾空蓄力起跳、释放技能爆发感、受击后退、boss 倒地翻滚、收集物品时举手 → 这些必须用具体动词 + 大幅度修饰,让人一眼看出在玩游戏。严禁用"轻微 / 小幅 / 微微 / 缓慢"压缩主角动作的幅度,那样画面会变成 cinemagraph 不是 gameplay。
经典组合:
- 镜头 slow push-in + 主角猛烈挥剑 → 爆发感拉满
- 镜头 stable tracking shot follow + 主角剧烈跑动 → 跑酷感
- 镜头 gentle orbit + 主角法杖大幅举起施法 → 高光镜头
- 镜头 subtle handheld + 主角与敌人剧烈对抗 → 战斗紧张感
- 镜头 locked-off fixed + UI 弹窗从屏外滑入 + 数字跳动 → 结算反馈
互动反馈是伪实机的灵魂(每条视频 prompt 至少写一个,关键镜头要写两个以上)
游戏画面之所以像游戏,不是因为人物在动,是因为画面对玩家的"按键操作"有可见的视觉响应。互动反馈分四类,点击/按键反馈是其中最容易被忽略但最重要的一类——它是把"被动播片"和"在玩游戏"区分开的关键差异。
点击 / 按键反馈类(玩家操作那一瞬间的视觉响应,必须有)
这是观众潜意识识别"这是 gameplay 不是过场动画"的关键。每个有玩家主动操作的镜头必须明确写出"按下那一帧"的视觉反馈。可选写法:
- 按键图标按下凹陷动画:底部技能栏 X 键图标在 X 秒处被按下瞬间图标缩小一帧(约 0.1 秒)然后回弹满亮
- 圆形涟漪从按键中心向外扩散:A 键图标被按下瞬间一圈白色或金色圆形涟漪从图标中心向外扩散并淡出
- 按键边缘高亮闪烁:图标外圈短暂金色或彩色描边光晕一次
- 画面浮现按键提示标签:右下角浮现"X"小标签代表玩家刚按下该键并节奏脉动一次后消失
- 数字伤害弹出:攻击命中瞬间从目标位置弹出橙色或红色数字"-128"并向上飘 + 渐隐
- 十字准星 / 锁定标记缩放:瞄准瞬间画面中央十字准星从大缩到小做锁定动画
- 菜单选项被选中:选项条被选中瞬间整条高亮放大并左侧出现箭头滑入
- 技能蓄力进度条:长按技能时图标边缘进度条从 0% 顺时针填充到 100%
- 二次确认提示:危险操作弹出"按住 R 二次确认"的圆形按住提示
HUD 状态反馈类(系统状态变化的反馈)
- 技能图标从亮 → 释放后变灰 + 金色环形冷却倒计时顺时针填充
- 血条扣减:受击瞬间血条数值闪红色然后下降到新值
- 蓝条消耗:施法瞬间蓝条快速从满槽下降到三分之一
- 经验数字滚动跳动:从 0 跳到 240 数字翻页
- 操作提示按键图标做"按下被按"颜色脉冲一次
- 任务标记从屏幕外飞入 + 落定 + 弹一下确认
- 任务条从顶部滑入 + 文字逐字显示
- 战斗提示框从画面边缘滑入 + 高亮 + 停留
- 弹窗从屏幕外滑入到位 + 升级金光爆开
场景反馈类:
- 敌人受击后退翻飞 + 击退尘土飞扬
- 敌人倒地化光粒缓慢消散
- 收集物品瞬间画面闪一下白光 + 物品图标从世界场景飞入背包栏
- 互动 NPC 头顶冒出对话气泡或感叹号
- 释放技能瞬间地面绽开魔法阵 + 粒子上扬
- 命中瞬间屏幕轻微震屏 + 红色边缘晕染(受击)或 金色边缘晕染(命中)
镜头反馈类:
- 释放大招时镜头微震一次
- 击杀 BOSS 瞬间画面短暂白闪
- 关键剧情瞬间慢动作 0.3 秒(仅剧情向)
严禁出现的写法
- ❌ "主角轻微迈步两到三步"、"动作幅度小"、"右臂随步伐轻微摆动" → 这是 cinemagraph 不是 gameplay
- ❌ fast / cinematic / epic(这些词模型不理解,但不代表主角不能做大动作,要用具体动词)
- ❌ 多个镜头运动复合(一段只用一个主镜头,不写"slow push-in then orbit")
- ❌ 在视频 prompt 里写台词原文
- ❌ MJ 风格的 --ar / --stylize / --sref / --no 参数
- ❌ 长串负面词列表(约束 1 到 2 句话写完即可)
- ❌ 重复图片里已有的主体描述(视频 prompt 只写"变化"和"运动")
- ❌ 任何位置出现破折号
镜头序列设计逻辑
演示向 6 镜头模板(默认)
镜头 1|标题画面 / Logo 浮现 → locked-off fixed (4s)
镜头 2|世界远景 + 任务标记 → gradual pull-out (6s)
镜头 3|主角越肩行走 → tracking shot follow (6s)
镜头 4|战斗起手特写 → slow push-in (5s)
镜头 5|技能释放 / 关键动作 → gentle orbit (6s)
镜头 6|结算页 / Victory / 经验弹窗 → slow push-in (5s)
合计 32 秒
演示向 10 镜头扩展
在 6 镜头基础上加:
- 装备菜单(locked-off fixed)
- 过场对话(locked-off fixed)
- BOSS 登场(gentle orbit)
- 死亡 / 重生(subtle handheld)
剧情向 8 镜头模板(默认)
镜头 1|场景远景 + 主角剪影 → gradual pull-out (6s) + 旁白
镜头 2|主角越肩特写 → slow push-in (7s) + 主角独白
镜头 3|环境推进 / 走向冲突 → tracking shot follow (6s)
镜头 4|关键人物登场 → locked-off fixed (6s) + 对方开场白
镜头 5|对峙中景 → subtle handheld (8s) + 主角回应
镜头 6|情绪转折特写 → slow push-in (7s) + 关键台词
镜头 7|动作 / 高潮 → gentle orbit (6s) + 环境音
镜头 8|结尾拉远 + 字幕 → stable aerial drone (6s) + 旁白收尾
合计 52 秒
镜头数和时长对照
| 镜头数 | 总时长建议 | 单段时长 |
|---|
| 6 | 30 到 40s | 5 到 7s |
| 8 | 45 到 55s | 6 到 8s |
| 10 | 60 到 75s | 6 到 8s |
| 12 | 80 到 95s | 6 到 8s |
角色锚点描述(一致性核心)
在 MD 顶部写一段 30 到 50 字的"角色锚点描述",提取角色最核心的视觉特征:
角色锚点:{年龄段 + 体型},{标志性服装},{标志性色彩},{标志性道具/武器},{发型/头饰},{表情基调}。
所有镜头的图片 prompt 里描述主角时,必须复用这段锚点的核心要素,确保 6 到 10 张图人物一致。每次输出后,自检一下:把所有镜头的"主角"那段抽出来,看看核心特征是不是都一样。
0.5 号 UI Style Guide(强制产出,所有镜头共用的 UI 一致性锚点)
为什么需要:同一款游戏所有截图必须共用同一套 HUD 视觉语言(血条颜色形状、字体、图标风格、迷你地图样式、字幕条样式)。如果每张图血条颜色不一样、字体不一样、迷你地图边框不一样,观众一眼识破是 AI 拼的。0 号管角色一致性,0.5 号管 UI 一致性,两者缺一不可。
0.5 号产出形式:一张"UI 概览图"prompt + 一份"UI 规范字典"
0.5A 概览图 Prompt(图片侧):把所有 HUD 元素摆进一个空白游戏场景(比如刚进入游戏的菜单背景),让 GPT Image 2 一次画出所有 UI 元素的统一样式,作为后续每个镜头喂 Seedance 时的 @图片 视觉锚点。
模板:
生成一张本项目专用的 UI 风格总览截图,画面是一个用作 UI 展示的简洁{游戏类型}菜单背景({背景描述:纯色/简洁场景/渐变背景})。在这个画面上完整展示项目的所有 HUD 元素以便后续每个游戏内截图都沿用相同的视觉规范:左上角{血条样式描述},左上血条下方{蓝条样式描述},血条左侧{角色头像框样式};右下角{迷你地图样式}附{指南针描述};顶部中央{任务条样式}显示示例文字"{示例任务名}";底部中央{操作提示样式}显示示例按键{按键风格}+示例文字;右上方{额外辅助 UI 描述,如经验条/等级/金币};{战斗 UI 与剧情字幕条的统一样式描述}。所有元素的字体为{字体描述},配色为{主色 + 辅色 + 强调色},图标风格为{图标风格},描边为{描边规范},圆角为{圆角规范}。整体匹配{年代质感词},比例 16:9,作为后续所有游戏内镜头的 UI 视觉锚点参考图。
0.5B UI 规范字典:用 JSON 代码块 + 自然语言摘要双形态产出,严禁用 markdown 表格(表格无法整段复制喂给 GPT Image 2 / LLM,渲染后断行复制会丢字段)。每个项目固化一份,所有镜头 prompt 描述 HUD 时必须使用字典里的统一表述。
JSON 形态(给程序、LLM、复制粘贴用):
{
"ui_style_guide": {
"color": { "primary": "<主色>", "secondary": "<辅色>", "accent": "<强调色>" },
"fonts": {
"title": "<标题/Logo 字体描述>",
"body": "<正文/数字字体描述>",
"subtitle": "<剧情向字幕条字体描述,演示向可填 null>"
},
"hp_bar": "<HP 条形态/位置/颜色/描边/附属元素>",
"mp_or_stamina_bar": "<蓝条或体力条形态>",
"level_badge": "<等级显示形态>",
"minimap_or_radar": "<迷你地图/雷达形态>",
"quest_bar": "<任务条形态>",
"control_hint": "<操作提示样式 + 按键图标风格>",
"enemy_hp_bar": "<战斗中敌方血条形态>",
"skill_icon_bar": "<技能栏形态 + 冷却环样式>",
"popup": "<拾取/奖励弹窗形态>",
"level_up_fx": "<升级特效形态>",
"victory_screen": "<胜利结算样式>",
"subtitle_bar": "<剧情向字幕条规范,演示向可填 null>",
"quest_marker_icon": "<任务标记图标形态>",
"corner_radius": "<圆角规范>",
"stroke": "<描边规范>"
}
}
自然语言摘要形态(30 到 80 字一段,给读者快速扫读 + 给镜头 prompt 直接引用):
"HUD 整体规范:主色 X、辅色 Y、强调色 Z。HP 条 ……;任务条 ……;操作提示 ……;战斗血条 ……。所有镜头 prompt 描述 HUD 时复用以上表述,状态可变样式不可变。"
镜头 prompt 引用 UI Style Guide 的方式
每个镜头的图片 prompt 在描述 HUD 时必须显式引用字典里的字段表述而不是另起炉灶。两种写法都可以:
写法 A(短引用,适合中等颗粒度):
……HUD 沿用本项目 UI Style Guide 定义的统一样式:左上血条蓝条 + 角色头像框,右下圆形迷你地图带金色羽毛任务标记,顶部任务条显示"{当前镜头任务文字}",底部操作提示"{当前镜头按键提示}"……
写法 B(完整复用,适合复杂颗粒度):
……界面 HUD 元素:左上角圆角矩形血条橙红色填充黑色描边附圆形角色头像框金色描边(与 0.5 号 UI Guide 一致),血条正下方等长天蓝色蓝条;右下角圆形迷你地图半透明深绿底金色细描边含 N 字指南针和金色羽毛任务标记图标(与 0.5 号 UI Guide 一致);顶部中央半透明黑色任务条圆角白字描黑边显示"{当前任务名}"……
关键约束:所有镜头里出现的同一个 HUD 元素,文字描述必须用同一组关键词。如果 0.5 号字典里写"橙红色血条 + 金色头像框",那 6 个镜头 prompt 里绝对不能有的写"红色血条银色头像框"、有的写"橙色生命条圆形头像"。变化只能体现在"状态"(满槽 / 半槽 / 空槽),不能在"样式"。
0.7 号 HUD 引用语法 + 参考图继承图谱(强制产出)
为什么需要:实际跑图时整体 HUD 风格是全局一致的(由 0.5A UI 总览图 + 0.5B 字典固化),但每个镜头到底"完全沿用前一张"还是"沿用 HUD + 替换场景"还是"沿用 HUD + 新增临时元素"差别很大。如果不在 prompt 主包里告诉用户每个镜头跑图时"用 {{{图N}}} 引用哪一张作为 HUD 基准",用户每次都要自己重写 HUD 描述,效率低且容易漂移。0.7 号的两个职责:① 在每张图片 prompt 内部直接用 {{{图N}}} 写明 HUD 该参考哪张前序图(核心);② 在主包统一章节给出"图号映射表 + 继承图谱"让用户一眼看懂整条链路。
核心机制:{{{图N}}} 引用语法 + 自包含参考图说明段
关键设计原则:用户跑图时把 prompt 喂给 Codex / GPT Image 2 / Nano Banana Pro 等模型时,模型一次接收 prompt + 多张参考图。prompt 文本必须自包含每张参考图的角色定义,让模型不用查任何外部映射表就能自己识别"哪张图是 HUD 基准、哪张是角色锚点、哪张是时段延续锚点"。{{{图N}}} 是给用户读的图号代号,自包含说明段是给模型读的角色定义。两者必须配套出现。
1. 每个镜头图片 prompt 开头必须有"参考图说明段"
位置:图片 prompt 的最开头第一段(在"生成一张……风格的游戏实机截图"之前)。
模板:
"本次跑图输入的参考图共 N 张,按顺序分别为:第 1 张是主角角色四视图设定稿(用作角色形象一致性锚点),第 2 张是本项目 0.5A UI Style Guide 总览图(用作 HUD 样式 / 位置 / 字体 / 配色基准锚点),第 3 张是镜头 X 跑出的成品截图(用作 HUD 实战基准),第 N 张是……(继续列举每张图的角色与用途)。请按下方 prompt 描述生成本镜头画面,描述中提到'沿用 HUD 基准图'时即指第 N 张参考图。"
实际范例(镜头 3):
"本次跑图输入参考图共 3 张:第 1 张是主角四视图设定稿(角色形象锚点){{{图1}}},第 2 张是项目 0.5A UI Style Guide 总览图(HUD 样式基准){{{图2}}},第 3 张是镜头 2 成品截图(HUD 实战基准){{{图3}}}。本镜头生成时角色形象沿用第 1 张参考图、HUD 整套样式与位置沿用第 3 张参考图、UI 配色 / 字体 / 图标风格延续第 2 张参考图的规范。"
硬约束(绝不允许简写):参考图说明段是用户判断"挂哪张图"的唯一来源(挂图清单已取消),写错或写漏会直接导致跑图挂错图。每张参考图必须独立成句,含三要素:
- 图号:
{{{图N}}} 三层花括号代号 + 自然语言序数("第 N 张")
- 文件性质:这张图是什么(主角四视图设定稿 / 0.5A UI Style Guide 总览图 / 镜头 X 成品截图 / 夜间时段延续锚点等)
- 承担角色:这张图在本镜头里负责什么(角色形象锚点 / HUD 样式基准 / HUD 实战基准 / 时段延续锚点 / UI 配色基准等)
绝不允许的简写形态:
- ❌ "输入 2 张:图1 主角 + 图2 HUD"(缺文件性质,承担角色被压成两字)
- ❌ "本次输入
{{{图1}}} {{{图2}}} {{{图3}}} 三张参考图"(只有图号没有性质和角色)
- ❌ "参考图:角色四视图、UI 总览、镜头 2 成品"(缺图号代号,模型无法对应槽位)
每张参考图都必须像上面"实际范例(镜头 3)"那样独立一句,三要素一个不少。
2. {{{图N}}} 变量引用语法
- 变量名格式:必须是
{{{图N}}}(三层花括号包裹"图"+ 数字,例:{{{图1}}} {{{图2}}} {{{图5}}}),N 是图号映射表里的编号
- 引用范围:仅引用 HUD 部分(位置 / 样式 / 字体 / 配色 / 图标),不引用主角 / 场景 / 光线 / 时段
- 引用必须配套自然语言:单独写
{{{图3}}} 模型不识别,必须写成"沿用第 3 张参考图({{{图3}}},即镜头 2 HUD 实战基准)"这种"自然语言描述 + 变量代号"双形态
- 引用强度三档:
- 整套沿用:
HUD 整套沿用第 3 张参考图({{{图3}}},即镜头 2 HUD 实战基准)的样式、位置、字体、配色不变,仅状态有变化:{描述状态变化}
- 主体沿用 + 新增临时元素:
HUD 主体沿用第 3 张参考图({{{图3}}})的样式与位置(HP / 体力条 / 迷你地图 / 任务条 / 三键操作全部位置与配色不变),本镜头新增临时元素:{描述新增}
- 主体沿用 + 局部变更:
HUD 主体沿用第 3 张参考图({{{图3}}}),本镜头变更:任务条文字从"X"变更为"Y" / 状态从满槽变到 N%
- 大前提:整体 HUD 风格全局一致是由 0.5A UI Style Guide 总览图 + 0.5B 字典共同固化的,所以引用语义是"HUD 部分锚定到这张图"而不是"整张图克隆",模型不会误以为要把场景也复制过来
图号映射表(每个项目必出,放在 0.7 章节开头)
用户实际跑图时挂参考图槽是按"图1 / 图2 / 图3"顺序排列的。MD 主包必须给出图号映射表让用户知道每个 {{{图N}}} 对应哪张实际文件。格式如下:
图号映射表(跑图时按此顺序挂参考图槽):
- 图1 = 0 号主角四视图(`0号-主角四视图.png`)
- 图2 = 0.5A UI Style Guide 总览图(`0.5A-UI总览图.png`)
- 图3 = 镜头 2 成品截图(`镜头2-成品截图.png`,是后续镜头 HUD 引用的实战基准)
- 图4 = 镜头 4 成品截图(夜间场景延续锚点,仅镜头 5 / 6 参考)
- 图N = ……
编号建议:把"永久锚点"(0 号主角 / 0.5A UI 总览)放在图 1 / 图 2 位置(小编号),把"动态锚点"(前序镜头成品)放在大编号位置。这样每个镜头 prompt 引用时一目了然。
每个镜头 prompt 里 HUD 段落的标准写法
把原来"界面 HUD 元素沿用本项目 UI Style Guide 统一样式:左上角朱砂红卷云纹描边……(一长段重写)"改写为:
"HUD 整套沿用 {{{图3}}} 的样式与位置(HP / 体力条 / 迷你地图 / 顶部任务条 / 底部三键 / 右上铜钱声望),仅状态变化:体力条从满槽消耗到约 55%,加速键释放后变灰附金色环形冷却进度 60% 顺时针填充,迷你地图朱砂三角玩家位置从北部移到西北方位。本镜头新增临时元素:画面前景右下方胡商货摊头顶冒出小型"葡萄"商品气泡图标。"
这样写的好处:
- 用户跑图时挂
{{{图3}}} 实际文件,模型自动学到完整 HUD 样式
- prompt 字数大幅压缩,重点突出"本镜头变化"
- 同一 HUD 元素跨镜头描述零漂移(因为根本没重写)
继承图谱 JSON(放在图号映射表之后)
{
"hud_reference_chain": [
{"shot": 0, "name": "主角四视图设定稿", "produces": "图1(0号-主角四视图.png)", "hud_reference": "无 HUD"},
{"shot": "0.5A", "name": "UI Style Guide 总览图", "produces": "图2(0.5A-UI总览图.png)", "hud_reference": "本身定义基准 HUD"},
{"shot": 1, "name": "<镜头1主题>", "produces": "无(HUD 全隐藏视镜头类型而定)", "hud_reference": "<不引用 / 引用 {{{图2}}}>"},
{"shot": 2, "name": "<镜头2主题>", "produces": "图3(镜头2-成品截图.png,成为后续 HUD 实战基准)", "hud_reference": "{{{图2}}}(首次按 0.5A 落地)"},
{"shot": 3, "name": "<镜头3主题>", "produces": "<可选产出>", "hud_reference": "{{{图3}}} 整套沿用,状态变化"},
{"shot": 4, "name": "<镜头4主题>", "produces": "图4(如时段切换需要为后续提供延续锚点)", "hud_reference": "{{{图3}}} 主体沿用 + 新增临时 HUD"},
{"shot": 5, "name": "<镜头5主题>", "produces": "<可选产出>", "hud_reference": "{{{图3}}} 主体沿用 + {{{图4}}} 时段延续"},
{"shot": 6, "name": "<镜头6主题>", "produces": "<可选产出>", "hud_reference": "{{{图3}}} 主体沿用 + 新增结算页元素"}
]
}
镜头标题下不再单独写挂图清单(防止图号集合漂移)
实战发现"挂图清单"区块和 prompt 内文里的 {{{图N}}} 引用集合非常容易飘移:挂图清单写了图 3 但 prompt 内文只引用了图 1,或者反过来 prompt 突然多冒出个 {{{图5}}} 挂图清单漏写。因此挂图清单作为独立区块整体取消,本镜头要挂哪几张图改由以下三个权威源共同确定,且必须严格一致:
- prompt 内文的"参考图说明段"(首段):自包含说明本次输入了几张图分别是什么角色(主角锚点 / HUD 样式基准 / HUD 实战基准 / 时段延续锚点等)
- prompt 内文的
{{{图N}}} 引用集合:本镜头实际要挂的图号 = prompt 内文里出现过的所有 {{{图N}}} 集合(自动推导,模型无须单独再写一遍)
- 0.7 节继承图谱 JSON 的
hud_reference 字段:本镜头一行 hud_reference 字段里列出的图号 = 上面 2 的集合
变化点信息并入 prompt 内文第三段"HUD 描述段"末尾("本镜头新增临时元素:…"一句话)承担,不再独立区块。
三个权威源若任一不一致,视为输出有缺陷,整份重做。
0.7 号的核心规则(写图谱时必须遵守)
- 图号编号永久稳定:图 1 / 图 2 在整个项目里固定指向 0 号主角 / 0.5A UI 总览图,不要在不同镜头里给同一个编号塞不同含义
- 整体 HUD 风格全局一致是大前提:所有镜头的 HUD 样式、位置、字体、配色由 0.5A 总览图 + 0.5B 字典固化,
{{{图N}}} 引用只是把这个固化结果具体化到某一张实战图上
{{{图N}}} 引用 ≠ 整张图克隆:只引用 HUD 部分,场景 / 主角姿势 / 光线 / 时段由本镜头 prompt 单独描述
- 临时 HUD 元素(结算页卷轴 / 倒计时 / 任务进度条 / 升级特效 / 战斗血条等仅在特定镜头出现的元素)不进 0.5A 总览图也不写进 0.5B 字典,也不写进引用语法,只在本镜头 prompt 里用文字单独描述
- Seedance 2.0 跑视频:视频 prompt 里同样可以用
@图片N 或 {{{图N}}} 引用首帧,写法保持和图片 prompt 一致
- 不强制每镜头都改写:如果某个镜头 HUD 变化太大(如结算页几乎覆盖整个画面),就放弃引用法回归完整描述;引用法是工具不是教条
多角色项目:每个主要角色独立一张四视图(重要)
如果项目包含多个主要角色(正派 + 反派、双人组队、三人小队、群像),每个角色单独产出一张四视图设定稿,编号 0a / 0b / 0c…,绝不要把多个角色合在一张图里。AI 在一张图上同时画多个角色时极易出现服装混搭、道具串联、比例失衡、辨识度衰减等问题。每个角色独立四视图后,再用 Seedance 多图参考时分别 @图片 引用。
道具数量法则:每个角色保留 1 件标志性道具(武器或法器),最多再加 1 件辅助配饰(吊坠/徽章/绑带)。道具堆超过 2 件,AI 在四个视图里几乎一定串位(短弓变到右肩、急救包变成腰包、手套变成袖口)。少即是多。
0 号四视图的"纯白背景"必须放在首句最高权重位置(关键经验)
AI 生图模型对 prompt 开头的关键词权重最高,对中间和结尾的权重逐级衰减。"纯白背景"必须是 prompt 的第一句话,而不是埋在第二、第三个分句里。
错误写法("纯白背景"埋在中间,模型会忽略):
"生成一张原创唯美奇幻 AAA 大作游戏角色的官方四视图定妆设定稿,纯白背景上水平并排四个独立角度……"
正确写法("纯白背景"占据首句最高权重位置):
"纯白背景的角色四视图定妆设定稿,背景为纯净的 100% 白色 #FFFFFF 平面无任何环境元素无任何场景细节无任何光晕无任何粒子无任何彩色渐变,整张画面只有四个独立的角色视图水平并排在纯白底上……"
末尾必须二次硬性禁止具体背景元素
只说"无任何环境元素"太抽象,模型还是会脑补出森林、光柱、雾气。末尾必须显式列出禁止清单:
"再次强调约束:背景必须是纯白色 #FFFFFF 平面绝无任何元素,严禁画森林、古树、苔藓、雾气、光柱、丁达尔光、光斑、魔法粒子、装饰花纹、地面、阴影投影、彩色渐变……"
禁止清单必须包含当前项目可能联想到的所有环境元素,比如:
- 唯美奇幻类项目:森林、古树、苔藓、雾气、光柱、丁达尔光、光斑、魔法粒子、藤蔓装饰、花瓣
- 末世写实类项目:废墟、烟尘、烟雾、藤蔓、锈迹、地面、远景建筑剪影
- 童话卡通类项目:星星、彩虹、云朵、糖果、装饰图案、彩色渐变
- 赛博朋克类项目:霓虹灯、电路纹路、扫描线、数据流、城市剪影
角色自身的发光/特效必须限定"不向背景外溢"
如果角色自带发光元素(任何形式的荧光、魔法光辉、能量眼眸、烟雾形态、粒子飘散),prompt 必须明确这些光效仅出现在角色身体的局部位置不向背景投射或扩散。写法是占位符模板:
"{发光/特效元素} 仅出现在 {角色身体的具体局部位置} 不向背景{发散 / 投射 / 扩散 / 外溢 / 辐射}"
不写这一句,模型会把发光元素扩展成全屏光晕、彩色雾霾、粒子背景,白底就被破坏了。写到角色描述后面立刻加一句"约束",不要等到 prompt 末尾再补。
风格定位明确"定妆稿"而非"游戏截图"
最后还要补一句:
"整张图风格为官方角色定妆参考稿不是游戏内场景截图也不是过场动画截图。"
这是因为同样的角色描述如果不限定"定妆稿",模型会优先按"游戏截图"理解,自动加上场景。
0 号四视图的标准布局(重要)
参考样式:左侧 1 张正面特写头像(占据画面左侧约 30%,从头部到锁骨)+ 右侧 3 张全身(正面 / 侧面 90 度 / 背面,水平等距排列各占约 23%)。这是参考生视频领域的标准角色定妆稿格式,喂给 Seedance 做参考时一致性最强。Prompt 里必须把这个布局写明确:
- 强调"水平并排四个独立角度"
- 强调"纯白背景"
- 强调"柔和均匀正面光照,无戏剧化光影"
- 不要附加表情变体网格、装备拆解小图、色板色块、文字标注(这些会污染 Seedance 的参考权重)
如果用户后续要"完整设定集"(含表情+装备+色板),那是另一个产物,不放在 0 号里。
字幕脚本写作(剧情向专用)
字幕脚本是给配音用的,不是给视频模型的。要求:
- 每句话控制在 8 到 18 字:太长 5 秒念不完,太短没信息量
- 避免"主谓宾完整复杂句":游戏过场对白偏向短促有力,"我会回来的"比"等到雪化的时候我一定会回到这个地方"更好
- 角色之间语气要有差异:主角 vs 反派 vs 旁白,三个人的措辞应当一耳朵能区分
- 绝对不要照抄已有游戏的台词(不要写《最后生还者》《GTA》《巫师》里出现过的原句)
TTS 配音脚本写作(剧情向专用)
为每条字幕推荐音色 + 语速 + 情感:
| 工具 | 推荐音色举例 | 适合场景 |
|---|
| 豆包语音合成 | 沉稳男声 / 灵动女声 / 沧桑老者 | 国产游戏调性 |
| ElevenLabs | Adam / Bella / Rachel | 欧美游戏调性 |
| 火山引擎语音 | 解说男声 / 戏剧女声 | 旁白 / 剧情 |
输出时给每条字幕标:音色:XX / 语速:0.9 / 情感:低沉。
自检清单(输出前必做)
常见输入示例
用户:"做一个《洛克王国》小红帽的实机演示"
→ 关键词模式 / 默认 Switch 卡通渲染 / 动作 RPG / 第三人称越肩 / 6 镜头 / 演示向
→ 必出 0 号角色参考表 + 6 镜头 + 时间轴
用户:"基于这张图(贴图)做一个赛博朋克剧情向"
→ 参考图模式 / 默认 PS5 现世代 / 第三人称越肩 / 8 镜头 / 剧情向
→ 跳过 0 号 + 8 镜头 + 时间轴 + 字幕脚本 + 配音脚本
用户:"给我家猫做个 GTA 风的"
→ 关键词模式 / 默认 PS5 现世代 / 开放世界 / 第三人称越肩 / 6 镜头 / 演示向
→ 必出 0 号宠物风格化 + 6 镜头 + 时间轴
不要做的事
- 不要追问已经能从上下文推断出的参数
- 不要在动手前列一份长长的"我打算这样做"先征求意见,直接出货
- 不要把整个教程文档贴回来作为铺垫
- 不要在每个镜头之间加情节解说和过渡文字(输出是 prompt 包不是策划案)
- 不要给 prompt 加 emoji 装饰
- 不要写"以下是您要的内容"这类客套话