| name | cinematic-prompt |
| description | 电影级视频AI提示词创作引擎。根据用户场景描述,按五层架构生成逐秒分镜脚本。
触发词:视频提示词、分镜脚本、电影分镜、cinematic prompt、fight scene、动作戏、打戏分镜、视频脚本
|
| weight | heavy |
Cinematic Prompt Skill
电影级AI视频提示词创作引擎 — 将用户的场景描述转化为可直接投喂视频生成AI的逐秒分镜脚本。
Quick Start
echo "Workflow Skill — LLM 直接执行,无 CLI 入口"
五层架构(必须逐层填充,缺层即废稿)
| 层级 | 名称 | 写几次 | 职责 |
|---|
| L1 | 全局基调 | 1次 | 画面DNA:焦段、光圈、质感、禁止项 |
| L2 | 素材锚定 | 1次 | 角色→视觉参考,场景→音频参考 |
| L3 | 叙事预设 | 1次 | 1-3句完整剧情弧线(给AI剧透) |
| L4 | 逐秒分镜 | 每拍 | 时间戳|镜头语言|动作描述|音效设计 |
| L5 | 音效设计 | 每拍 | 物理环境层 + 动作打击层 + 人声表演层 |
L1 全局基调 — 参数决策树
根据场景类型选择参数组合:
IF 写实格斗/动作:
→ 35mm, f2.8, 胶片颗粒, 锐利, 景深自然
→ 禁止:慢动作, 降速回放, 子弹时间, BGM, 字幕
IF 史诗战争/大场面:
→ 24mm, f4, 浓郁色调, 大景深, 高对比
→ 禁止:手持晃动, 快切, BGM
IF 亲密对话/文戏:
→ 85mm, f1.4, 柔和质感, 奶油虚化
→ 禁止:运动模糊, 镜头晃动
IF 追逐动作:
→ 16mm, f5.6, 手持感, 高锐度
→ 禁止:固定机位, 慢动作
IF 恐怖悬疑:
→ 50mm, f2, 低饱和, 暗部细节丰富
→ 禁止:明亮画面, 快节奏剪辑
L1 输出模板
电影级画面基调:{焦段}镜头,{光圈}光圈,{质感描述},
{颗粒/色彩倾向},景深{自然/浅/深},画面{锐利/柔和},
运动模糊{克制/明显},光影层次{清晰/戏剧化},
全程真实时间流速,
禁止{逐项列出}。
L2 素材锚定
每个出场角色必须绑定视觉参考。如用户提供了参考图/音频,按以下格式声明:
流程:{角色A名}
@{角色A参考图}
{角色B名}
@{角色B参考图}
{音频参考文件}
无参考图时:用 50-80 字文字描述角色外貌特征(体型、服装、发型、气质)替代 @图片。
L3 叙事预设
用 1-3 句话写清完整故事走向。必须包含:
- 谁先动手 — 开场主动权
- 攻防转换节点 — 何时反转
- 最终结局 — 谁赢、怎么结束
叙事弧线公式
{角色A}先{开场动作},{招式列举},但都被{角色B}{化解方式};
{角色B}{反击方式},{压制过程概述}。
{角色A}{反击尝试}但被{角色B}{抓住破绽方式},
最后{角色B}{终结技描述},{角色A}{最终状态}。
常见叙事模板
| 模式 | 弧线 | 适用场景 |
|---|
| 以弱胜强 | 被压制→觉醒→反杀 | 热血/主角光环 |
| 碾压局 | 试探→发现差距→被终结 | 展示反派/BOSS实力 |
| 势均力敌 | 互有攻防→消耗→险胜 | 宿敌对决 |
| 偷袭反杀 | 偷袭得手→被识破→反被终结 | 悬疑/智斗 |
L4 逐秒分镜 — 核心执行规则
分镜格式(四维,缺一不可)
{起始秒}-{结束秒}|{镜头语言}|{动作描述}|{音效设计}
镜头选择规则
动作幅度大(旋踢/飞踢) → 全景平视
单次打击命中 → 平视近景
连续快攻组合 → 近景环绕
微妙反应(稳身/调重心) → 特写微跟拍
对峙/展示气势 → 低角度固定
蓄力型重击 → 仰视 → 平视切
终结技(大幅度+命中细节) → 全景 → 近景切
动作编排六法则
| # | 法则 | 说明 |
|---|
| 1 | 因果律 | 每拍动作是上拍的直接后果,禁止凭空插入 |
| 2 | 攻防比 | 优势方攻:劣势方应 ≈ 2:1~3:1 |
| 3 | 力量梯度 | 打击力度递增:普通拳 → 重击 → 终结技 |
| 4 | 声音梯度 | 发力声递增:短促「喝」→ 凶狠「喝啊!」 |
| 5 | 后摇惩罚 | 大招有收招空隙,对手必须利用此窗口 |
| 6 | 身体反馈 | 被击后必须有物理反应(偏倒/后退/翻滚) |
节奏密度控制
| 节奏 | 秒/拍 | 用于 |
|---|
| 快攻密集 | 1 | 连续攻防、压制 |
| 过渡喘息 | 2 | 攻守转换、站稳 |
| 高潮终结 | 2-3 | 终结技、飞踢、被踢飞 |
总时长公式:总秒数 = Σ(各拍时长)。15秒场景通常 10-14 拍。
L5 音效三层模型
每拍至少覆盖2层(打击层 + 人声层必须):
| 层 | 内容示例 | 必要性 |
|---|
| 物理环境 | 脚步、衣料、地面摩擦、风声 | 按需 |
| 动作打击 | 拳风破空、踢击闷响、格挡声、摔地声 | 必须 |
| 人声表演 | 攻方喊声、受击方闷哼、喘息 | 必须 |
人声梯度表
| 打击强度 | 攻方 | 受击方 |
|---|
| 普通 | 短促「喝!」 | — |
| 中等 | 「哈!」 | 牙缝「呃!」 |
| 重击 | 沉重「喝!」 | 闷哼 |
| 终结 | 凶狠「喝啊!」 | 重闷哼 |
输出规则
最终输出格式
LLM 必须按以下结构输出完整提示词,用 write_file 保存为 .md 文件:
# [场景标题]
电影级画面基调:[L1 全文]
流程:[L2 全文]
[L3 叙事预设全文]
[L4+L5 逐秒分镜,每拍一行]
0-1秒|[镜头]|[动作]|[音效]
1-2秒|[镜头]|[动作]|[音效]
...
质量检查清单
输出前 LLM 必须自检:
场景适配速查
| 场景 | L1 焦段 | L4 镜头重点 | L5 音效重点 |
|---|
| 1v1格斗 | 35mm f2.8 | 因果律+后摇 | 人声梯度 |
| 群战 | 24mm f4 | 多焦点轮转+全景 | 环境层加重 |
| 追逐 | 16mm f5.6 | 跟拍+POV交替 | 呼吸+脚步 |
| 文戏对峙 | 85mm f1.4 | 正反打+近景 | 极安静+呼吸 |
| 爆炸场面 | 24mm f4 | 全景→特写冲击波 | 爆炸+碎片 |
Error Handling
| 错误 | 原因 | 修正 |
|---|
| AI生成慢动作 | L1 未声明禁止 | 在全局基调添加"禁止任何慢动作表现" |
| 动作前后矛盾 | 缺少因果链 | 检查每拍是否承接上拍结果 |
| 声音单调 | 未用人声梯度 | 按力量等级匹配发力声强度 |
| 镜头无变化 | 全用同一景别 | 按镜头选择规则匹配动作幅度 |
| 节奏平淡 | 时间分配均匀 | 用密度控制:快段1秒/拍,终结2-3秒/拍 |
| AI加BGM | L1 禁止项遗漏 | 明确添加"无背景音乐" |
| 角色外貌跑偏 | L2 锚定不足 | 补充参考图或详细文字描述 |