mit einem Klick
volcengine-video-understanding
// 火山视频理解 - 使用火山方舟视频理解 API 分析视频内容。通过 Files API 上传视频(推荐),支持大文件(最大512MB),可用于视频内容分析、物体识别、动作理解等。当用户需要分析视频、理解视频内容、提取视频信息时激活此技能。
// 火山视频理解 - 使用火山方舟视频理解 API 分析视频内容。通过 Files API 上传视频(推荐),支持大文件(最大512MB),可用于视频内容分析、物体识别、动作理解等。当用户需要分析视频、理解视频内容、提取视频信息时激活此技能。
抖音无水印视频下载和文案提取工具
Generate videos using Flyworks (a.k.a HiFly) Digital Humans. Create talking photo videos from images, use public avatars with TTS, or clone voices for custom audio.
Advanced document parsing with PaddleOCR. Returns complete document structure including text, tables, formulas, charts, and layout information. The AI agent extracts relevant content based on user needs.
漫剧生成器 - 基于 Seedance 的漫画风格短剧生成工具。支持以主角图片为基础,自动生成漫剧分镜脚本并生成视频。适用于创作漫画风格的短视频、角色故事、动画短片等。当用户想要生成漫画风格的视频短剧、角色故事或漫剧时使用此技能。
漫画风格视频生成器 - 专门生成日式治愈系、国风水墨、美式卡通等漫画风格的动画视频。内置8种漫画风格模板,支持图生视频,一键生成高质量漫画动画。当用户需要生成漫画风格、动画风格、手绘风格的视频时使用此技能。
使用字节跳动 Seedance 模型生成视频。支持文生视频和图生视频功能,通过 volcengine-ark SDK 调用 API。当用户需要生成视频、创建视频内容或基于文字/图片制作视频时激活此技能。
| name | volcengine-video-understanding |
| description | 火山视频理解 - 使用火山方舟视频理解 API 分析视频内容。通过 Files API 上传视频(推荐),支持大文件(最大512MB),可用于视频内容分析、物体识别、动作理解等。当用户需要分析视频、理解视频内容、提取视频信息时激活此技能。 |
使用字节跳动火山方舟视频理解 API(doubao-seed-2-0-pro-260215 等模型)对视频进行深度理解和分析。
推荐方式:Files API 上传 + Responses API 分析
需要设置 ARK_API_KEY 环境变量。
cp .canghe-skills/.env.example .canghe-skills/.env
.canghe-skills/.env 文件,填写你的 API Key:ARK_API_KEY=your-actual-api-key-here
export ARK_API_KEY="your-api-key"
process.env).canghe-skills/.env~/.canghe-skills/.envcd ~/.openclaw/workspace/skills/volcengine-video-understanding
python3 scripts/video_understand.py /path/to/video.mp4 "描述这个视频的内容"
python3 scripts/video_understand.py /path/to/video.mp4 "视频中出现了哪些人物?"
python3 scripts/video_understand.py /path/to/video.mp4 "分析视频中人物的情感变化"
python3 scripts/video_understand.py /path/to/video.mp4 "总结视频要点" \
--model doubao-seed-2-0-pro-260215 \
--fps 2
python3 scripts/video_understand.py /path/to/video.mp4 "描述视频" --output result.json
| 参数 | 默认值 | 说明 |
|---|---|---|
video_path | 必填 | 视频文件路径 |
instruction | 必填 | 分析指令/问题 |
--model | doubao-seed-2-0-pro-260215 | 模型 ID |
--fps | 1 | 视频采样帧率(预处理) |
--output | - | 结果输出文件路径 |
doubao-seed-2-0-pro-260215 (默认)doubao-seed-2-0-lite-250728doubao-seed-1-6-251015python3 scripts/video_understand.py ~/Desktop/video.mp4 "详细描述这个视频的内容,包括场景、人物和动作"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "用3句话总结这个视频的要点"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "视频中的人物在做什么动作?按时间顺序描述"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "分析视频中的场景变化和环境特征"
Files API 上传:
curl https://ark.cn-beijing.volces.com/api/v3/files \
-H "Authorization: Bearer $ARK_API_KEY" \
-F 'purpose=user_data' \
-F 'file=@video.mp4' \
-F 'preprocess_configs[video][fps]=1'
Responses API 分析:
{
"model": "doubao-seed-2-0-pro-260215",
"input": [
{
"role": "user",
"content": [
{
"type": "input_video",
"file_id": "file-xxxx"
},
{
"type": "input_text",
"text": "用户指令"
}
]
}
]
}
| FPS | 适用场景 |
|---|---|
| 0.3-0.5 | 慢节奏视频、静态场景、节省token |
| 1 | 一般视频分析(默认) |
| 2-3 | 快速动作、细节分析 |
from scripts.video_understand import analyze_video
result = analyze_video(
file_path="/path/to/video.mp4",
instruction="描述视频内容",
model="doubao-seed-2-0-pro-260215",
fps=1
)
# 提取回答
text = ""
for item in result.get("output", []):
if item.get("type") == "message":
for content in item.get("content", []):
if content.get("type") == "output_text":
text = content.get("text", "")
break
print(text)
常见错误及解决方案:
| 错误 | 原因 | 解决方案 |
|---|---|---|
| API Key 错误 | 未设置或错误 | 检查 ARK_API_KEY 环境变量 |
| 文件不存在 | 路径错误 | 检查文件路径 |
| 上传失败 | 文件过大或格式不支持 | 检查文件大小(<512MB)和格式 |
| 处理超时 | 视频过长或复杂 | 缩短视频或降低 FPS |