원클릭으로
agentkit-multimedia-shopping
// 基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程
// 基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程
为3-12岁儿童提供温馨亲切的睡前寓言故事和成语典故讲解。支持用户唤醒后提供故事列表选择,或直接讲解指定故事/成语。讲解时保持亲切温馨的语气、0.6倍正常语速、通俗易懂的表达,为小朋友营造舒适的睡前氛围。
Connect to and control Google Chrome browser using agent-browser with CDP (Chrome DevTools Protocol). Use when the user wants to automate their existing Chrome browser, see browser actions in real-time, or needs to control the Chrome instance they're already using. Handles installation, setup, connecting via remote debugging, and all browser automation tasks with live visual feedback.
小省导购员多智能体数字人口播带货视频生成系统,以"小省导购员"为核心人设,打造专业购物助手+数字人口播带货视频一体化服务。涵盖五大智能体(小省导购员、带货脚本师、数字人口播生成师、带货画面设计师、音画合成师),产出"数字人口播+带货画面+字幕音效"的成品视频,适配抖音、快手等短视频平台,支持淘宝、京东、拼多多、唯品会等全平台商品信息,具备知识库自动存取能力。
小省导购员数字人带货版即梦视频提示词生成系统,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),按照"主体+运动+场景+(镜头语言+光影+氛围)"公式输出中英文双版提示词,适配5s短视频。确保人物一致性、视觉连贯性、情绪连贯性,支持知识库智能复用和跨工具适配(Suno音乐、AI绘画),为数字人带货视频提供高质量提示词生成服务。
电商图片文案创作技能,支持多品类产品的吸引性文案生成,适用于电商平台的商品营销推广
电商视频营销创作技能,支持多品类商品的营销视频脚本生成,包含6阶段创作流程、智能体提示词框架、8种商品类型模板,适用于电商平台、社交媒体、品牌推广
| name | agentkit-multimedia-shopping |
| description | 基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程 |
| dependency | {"python":["Pillow>=10.0.0","requests>=2.28.0","numpy>=1.24.0"],"system":["echo \"Skill已加载\""]} |
本技能依赖以下Python包:
Pillow>=10.0.0
requests>=2.28.0
numpy>=1.24.0
使用AI绘画生成小省导购员角色形象:
输入信息:
生成流程:
输出:角色参考图(9:16竖屏)
使用AI绘画生成场景背景:
输入信息:
生成流程:
输出:场景参考图(9:16竖屏)
使用TTS生成导购员语音:
输入信息:
生成流程:
输出:语音文件(16kHz单声道wav)
使用音乐生成工具生成背景音乐:
输入信息:
生成流程:
输出:音乐文件(16kHz单声道wav)
使用多模态组合生成视频:
输入信息:
生成流程:
输出:完整视频(25秒,9:16竖屏)
功能说明:生成小省导购员数字人带货视频的完整流程
执行方式:
关键参数:
输出:完整带货视频(25秒,9:16竖屏)
功能说明:仅生成小省导购员角色参考图
执行方式:调用generate_character.py
关键参数:
输出:角色参考图(9:16竖屏)
角色固定特征描述
↓
AI绘画生成(角色形象+场景背景)
↓
语音合成(导购员语音+背景音乐)
↓
InfiniteTalk提示词生成(使用infinitetalk-shopping-avatar Skill)
↓
多模态视频生成(图像+音频+提示词)
↓
完整带货视频(25秒,9:16竖屏)
本技能与infinitetalk-shopping-avatar Skill协同工作:
协同流程:
本技能生成角色参考图 → infinitetalk-shopping-avatar生成提示词 → InfiniteTalk生成视频
本技能生成语音文件 → chinese-wav2vec2-base编码 → InfiniteTalk使用
本技能生成音乐文件 → chinese-wav2vec2-base编码 → InfiniteTalk使用