with one click
视频反推工具,支持视频抽帧、视觉模型分析、提示词生成,适用于视频创作参考、内容提取、场景分析
npx skills add https://github.com/anbeime/skill --skill video-frame-extractorCopy and paste this command into Claude Code to install the skill
视频反推工具,支持视频抽帧、视觉模型分析、提示词生成,适用于视频创作参考、内容提取、场景分析
npx skills add https://github.com/anbeime/skill --skill video-frame-extractorCopy and paste this command into Claude Code to install the skill
| name | video-frame-extractor |
| description | 视频反推工具,支持视频抽帧、视觉模型分析、提示词生成,适用于视频创作参考、内容提取、场景分析 |
| dependency | {"python":["opencv-python>=4.8.0","pillow>=10.0.0","requests>=2.28.0"]} |
依赖说明:
opencv-python>=4.8.0
pillow>=10.0.0
requests>=2.28.0
视觉模型配置: 需要配置视觉模型API密钥(如GPT-4V、Claude-3.5-Sonnet),环境变量格式:
export VISION_API_KEY="your_api_key"
export VISION_API_BASE="https://api.openai.com/v1" # 或其他API地址
export VISION_MODEL="gpt-4-vision-preview" # 模型名称
Coze Bot配置(推荐): 使用您发布的Coze Bot API进行视觉分析,环境变量格式:
export COZE_BOT_ID="7572557757883383858" # 您的Bot ID
export COZE_API_KEY="cztei_qHZQ0A5OSJjsmfZWmVb8bqu2BTbtB240YGbDYLhZpsIr8jER4aL4Aevyii8rnKfNs" # 您的API Key
Coze Bot的优势: 集成了官方抽帧插件和视觉模型,无需额外配置
步骤1: 视频抽帧
scripts/video_frame_extractor.py--input: 视频文件路径或URL--output: 输出图片目录--interval: 抽帧间隔(秒),默认1秒抽1帧--max_frames: 最大抽帧数,默认10帧# 示例: 抽取视频关键帧
python scripts/video_frame_extractor.py \
--input ./input/video.mp4 \
--output ./output/frames \
--interval 3 \
--max_frames 10
步骤2: 视觉分析
方案A: 使用Coze Bot API(推荐)
scripts/coze_bot_client.py--image_dir: 图片目录--prompt: 分析提示词(可选)--output: 输出JSON文件路径# 示例: 使用Coze Bot分析抽帧图片
python scripts/coze_bot_client.py \
--image_dir ./output/frames \
--prompt "分析场景内容、人物状态、构图特点,适合AI视频创作" \
--output ./output/analysis.json
方案B: 使用其他视觉模型API
scripts/visual_analyzer.py--input: 图片目录或单张图片路径--output: 分析结果JSON文件路径--prompt: 分析提示词(可选,默认分析场景/人物/构图)# 示例: 使用GPT-4V分析抽帧图片
python scripts/visual_analyzer.py \
--input ./output/frames \
--output ./output/analysis.json \
--prompt "分析场景内容、人物状态、构图特点,适合AI视频创作"
步骤3: 结果整合
抽帧参数:
--interval: 抽帧间隔(秒),越小抽帧越密集--max_frames: 最大抽帧数,控制输出数量--start_time: 开始时间(秒)--end_time: 结束时间(秒)--resolution: 输出图片分辨率,默认1080P分析参数:
--prompt: 自定义分析提示词--detail: 分析详细程度(brief/standard/detailed)--batch_size: 批量分析大小,默认5张# 1. 抽取视频关键帧
python scripts/video_frame_extractor.py \
--input ./input/source_video.mp4 \
--output ./output/frames \
--interval 2 \
--max_frames 8
# 2. 使用Coze Bot分析抽帧内容
python scripts/coze_bot_client.py \
--image_dir ./output/frames \
--prompt "详细描述场景、人物、构图,适合AI视频创作参考" \
--output ./output/analysis.json
# 3. 智能体读取analysis.json,生成创作提示词
# 智能体将根据分析结果组织内容,生成可用于AI创作的提示词
python scripts/video_frame_extractor.py \
--input ./input/video.mp4 \
--output ./output/frames \
--interval 5 \
--max_frames 5
# 使用Coze Bot
python scripts/coze_bot_client.py \
--image ./output/frames/frame_00001.jpg \
--prompt "分析这张图片的场景风格和构图"
# 或使用其他视觉模型
python scripts/visual_analyzer.py \
--input ./output/frames/ \
--output ./analysis.json \
--prompt "分析场景风格和构图"
抽帧输出:
./output/frames/
├── frame_00001.jpg
├── frame_00002.jpg
├── frame_00003.jpg
└── ...
分析输出(JSON):
{
"total_frames": 10,
"analysis": [
{
"frame_file": "frame_00001.jpg",
"timestamp": "00:00:00",
"description": "场景描述内容...",
"elements": ["人物", "背景", "道具"],
"style": "风格描述..."
},
{
"frame_file": "frame_00002.jpg",
"timestamp": "00:00:03",
"description": "场景描述内容...",
"elements": ["人物", "背景", "道具"],
"style": "风格描述..."
}
]
}
抽帧技术:
视觉分析:
Coze Bot优势:
性能优化:
基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程
为3-12岁儿童提供温馨亲切的睡前寓言故事和成语典故讲解。支持用户唤醒后提供故事列表选择,或直接讲解指定故事/成语。讲解时保持亲切温馨的语气、0.6倍正常语速、通俗易懂的表达,为小朋友营造舒适的睡前氛围。
Connect to and control Google Chrome browser using agent-browser with CDP (Chrome DevTools Protocol). Use when the user wants to automate their existing Chrome browser, see browser actions in real-time, or needs to control the Chrome instance they're already using. Handles installation, setup, connecting via remote debugging, and all browser automation tasks with live visual feedback.
小省导购员多智能体数字人口播带货视频生成系统,以"小省导购员"为核心人设,打造专业购物助手+数字人口播带货视频一体化服务。涵盖五大智能体(小省导购员、带货脚本师、数字人口播生成师、带货画面设计师、音画合成师),产出"数字人口播+带货画面+字幕音效"的成品视频,适配抖音、快手等短视频平台,支持淘宝、京东、拼多多、唯品会等全平台商品信息,具备知识库自动存取能力。
小省导购员数字人带货版即梦视频提示词生成系统,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),按照"主体+运动+场景+(镜头语言+光影+氛围)"公式输出中英文双版提示词,适配5s短视频。确保人物一致性、视觉连贯性、情绪连贯性,支持知识库智能复用和跨工具适配(Suno音乐、AI绘画),为数字人带货视频提供高质量提示词生成服务。
电商图片文案创作技能,支持多品类产品的吸引性文案生成,适用于电商平台的商品营销推广