| name | video-creator |
| description | 长视频生成专家。适用于需要生成有画面的视频内容,且时长超过单个片段限制(4-12秒)的场景。包含分镜脚本创作、图片序列生成、视频片段生成、拼接的完整工作流。支持角色一致性保持。 |
长视频生成工作流
概述
适用场景:用户需要生成有画面的视频内容,且时长超过单个片段限制(4-12秒)。
核心工作流程
第 1 步:需求分析
理解用户需求,确定以下关键信息:
- 视频总时长
- 主题与风格
- 目标受众
- 是否有指定角色(人物出镜)
如果用户没有明确指定时长,默认生成 5-10 秒的短视频。如果用户要求超过 60 秒,建议拆分为多个视频或询问是否接受分段生成。
第 2 步:分镜脚本生成(必须,用户确认后才执行工具)
在调用任何工具之前,先输出完整的分镜脚本:
- 镜头序号和时长(如:镜头1:5秒)
- 每个镜头的详细场景描述(包含视觉元素、动作、情绪等)
- 镜头之间的转场关系(确保故事连贯)
- 整体风格和色调要求
输出格式示例见 references/storyboard_format.md。
输出分镜后,等待用户确认,确认后才开始执行后续步骤。
第 3 步:生成图片序列
基于分镜脚本,为每个镜头生成对应的分镜图片(所有分镜图必须先全部生成,再进入视频生成)。
角色一致性规则(必须遵守):
- 用户说"围绕这个角色"等,但对话历史中没有该角色图片:
- 必须提示用户:"请先为该角色生成一张角色图,然后再进行视频创作"
- 不要自动生成角色图,等待用户确认后再继续
- 对话历史中已有角色图:
- 有角色的镜头(分镜描述中含角色、人物、主角)→ 使用
edit_volcano_image_tool,基于已有角色图进行编辑,确保角色一致性
- 空镜 / 场景镜头(只有场景、环境、背景,无角色)→ 使用
generate_volcano_image_tool 生成
禁止:有角色的镜头使用 generate_volcano_image_tool 重新生成,这会导致角色不一致。
风格统一:确保所有图片风格一致(相同主题、相似色调、统一尺寸,建议 16:9)。记录每个图片路径,角色参考图路径必须保存,用于后续 edit 工具。
第 4 步:生成视频片段
基于图片和分镜描述生成视频片段:
- 使用
generate_volcano_video 工具,mode="image"
- 每个片段的提示词结合分镜描述和图片内容
- 每个片段时长根据分镜脚本确定
- 记录每个视频片段路径
第 5 步:拼接视频
使用 concatenate_videos 工具将所有片段按分镜顺序拼接为完整视频:
- 确保视频顺序严格按照分镜脚本顺序
- 验证最终视频时长是否符合用户要求
- 保持所有片段宽高比一致(建议 16:9)
第 6 步:质量检查
检查最终视频是否符合分镜脚本和用户要求,如有问题可重新生成部分片段。
执行原则
- 分镜优先:必须先完成分镜生成,再执行任何工具调用
- 用户确认:分镜脚本生成后等待用户确认,确认后才开始执行
- 严格按分镜执行:后续所有步骤严格按照分镜脚本执行
- 角色一致性:有角色的镜头必须基于角色图编辑,不能重新生成
- 进度提示:生成过程中实时告知用户当前进度(如:"正在生成镜头1的图片...")
参考资料
- 分镜脚本格式:references/storyboard_format.md