| name | video-screenshot |
| description | 视频截图提取工具。从录屏视频(微信聊天录屏、会议录屏等)中自动抽取关键帧、去重并保存为图片文件,可用作法律证据。支持场景变化检测、关键帧提取、固定间隔、智能去重四种策略,配合内容区 dHash、像素差异、SSIM、滚动帧合并、OCR 文本去重和可选复合复核模式;当前模型支持图像输入时可复核被丢弃候选帧,文字模型跳过复核。触发词:视频截图、录屏截图、聊天记录截图、抽帧去重、视频截帧、视频关键帧提取。不要用于:视频压缩、视频剪辑、音频提取。 |
| version | 0.3.2 |
| author | 杨卫薪律师(微信ywxlaw) |
| homepage | https://github.com/cat-xierluo/legal-skills |
| license | MIT |
video-screenshot — 视频截图提取工具
从录屏视频(微信聊天录屏、会议录屏等)中自动抽取关键帧、去重并保存为可用作法律证据的图片文件。独立 Python CLI,无 Django 依赖。
适用场景
- 微信聊天录屏需要提取为逐页截图
- 会议录屏需要提取关键画面作为证据
- 长时间录屏需要去除重复帧,只保留有信息量的画面
- 需要将视频内容转换为可打印、可提交的图片证据
默认工作流
1. 确认输入
确认用户提供的视频文件路径。支持常见视频格式:.mp4 .mov .avi .mkv .webm .flv .wmv .ts
2. 确认参数
默认配置(大多数场景无需调整):
| 参数 | 默认值 | 说明 |
|---|
| 抽帧策略 | scene | 场景变化检测 |
| 场景阈值 | 0.10 | 变化幅度阈值(越小越敏感) |
| 定期采样间隔 | 2.0s | 静态画面保底采样(0=禁用) |
| 内容区裁剪 | 上 12% / 下 12% / 左右 4% | 排除状态栏、导航栏和边缘黑边后再比较 |
| dHash 去重阈值 | 4 | 对内容区计算汉明距离(0=禁用) |
| SSIM 阈值 | 0.93 | 结构相似度补充去重(0=禁用) |
| 滚动帧合并 | 关闭 | 需显式 --scroll-merge 开启 |
| OCR 去重 | 关闭 | 需显式开启 |
| 最小时间间隔 | 0.5s | 抑制同一时间段内过密保留帧(0=禁用) |
| 复核候选帧 | 关闭 | 需显式 --keep-drop-candidates 开启 |
| 最长边像素 | 0 | 保持原始分辨率(可设如 1920 限制尺寸) |
| JPEG 质量 | 2 | 最高质量(范围 1-31,越小越清晰) |
详细参数说明见 references/strategy-and-params.md,安装指南见 references/setup.md。
3. 执行抽帧
uv run scripts/extract.py -i <视频文件路径>
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup --keep-drop-candidates
uv run scripts/extract.py -i <视频文件路径> -s interval --interval 0.5
uv run scripts/extract.py -i <视频文件路径> -s keyframe -d 0
uv run scripts/extract.py -i <视频文件路径> -o /evidence/case_001/
uv run scripts/extract.py -i <视频文件路径> --scene-threshold 0.15
uv run scripts/extract.py -i <视频文件路径> --no-scroll-merge
4. 输出说明
输出目录包含:
| 文件 | 说明 |
|---|
frame_001_00m00s.jpg | 保留帧(序号 + 时间戳命名) |
frame_002_00m03s.jpg | 下一帧 |
_report.json | 元数据报告(输入信息、去重统计、每帧 SHA256) |
_review_candidates/ | 仅在 --keep-drop-candidates 开启时生成,保存被算法丢弃但可复核的候选帧 |
_report.json 可用于证据链追溯,记录了每帧的 SHA256 哈希、捕获时间戳和去重统计;复合模式下还会记录 review.drop_candidates,列明候选帧文件名、丢弃原因和时间戳。
归档目录中的 frames/ 只保留 _report.json 清单内的本次有效帧。每次运行前会清理输出目录中旧的 frame_*.jpg 和本工具报告文件,避免旧帧混入新结果;不会删除其他用户文件。
5. 复合复核模式
当用户担心算法漏掉关键截图,或反馈同一秒内截图过多时,优先使用复合复核模式:
- 运行
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup --keep-drop-candidates。
- 如果当前模型或可用工具支持图像输入,检查
_report.json 中 review.drop_candidates 记录的候选帧,重点看 min_gap、quality_*、duplicate_ssim、duplicate_scroll、ocr_duplicate 等原因对应的图片。
- 视觉复核只做保守补回:候选帧包含新的法律相关内容、金额、身份信息、承诺、关键对话或比已保留帧更清晰时,才建议补回;不要仅因画面略有差异删除已保留帧。
- 如果当前模型是纯文字模型,跳过视觉复核,并明确说明
_review_candidates/ 已生成但未做图像判断。
抽帧策略
| 策略 | 说明 | 推荐场景 |
|---|
scene | 场景变化检测,画面有显著变化时提取 | 聊天录屏、操作录屏(默认推荐) |
keyframe | 仅提取视频关键帧(I 帧) | 压缩视频、快速浏览 |
interval | 固定时间间隔提取 | 需要均匀时间采样 |
smart | ffmpeg 智能去重 | 不确定时尝试 |
去重与过滤机制
八级级联去重 + 可选过滤,每一级通过后才进入下一级:
- SHA256 精确去重 — 完全相同的帧直接跳过
- 内容区 dHash 感知哈希 — 排除顶部状态栏、底部导航栏和边缘黑边后比较结构
- 内容区像素差异 — 48×48 灰度缩略图的平均绝对差值
- SSIM 结构相似度 — 对内容区缩略图计算结构相似度,补充 dHash 漏检
- 滚动帧合并(需显式开启)— 检测连续帧纵向位移后的重叠区域,只保留代表性画面
- 内容质量过滤(默认开启)— 自动过滤空白页、启动/控制画面、页面切换过渡帧
- 模糊帧过滤 — Laplacian 方差低于阈值的帧视为模糊跳过,需
--filter-blur 开启
- OCR 文本相似度 — 比较最近 4 帧的 OCR 文本(SequenceMatcher + Jaccard),需
--ocr-dedup 开启
- 复核候选帧保存 —
--keep-drop-candidates 保存被前述规则丢弃的候选帧和原因,供多模态复核
依赖
| 依赖 | 版本要求 | 安装方式 |
|---|
ffmpeg | ≥ 5.0 | brew install ffmpeg |
Python | ≥ 3.10 | 系统自带或 brew install python |
uv | 最新 | brew install uv |
Pillow | ≥ 10.0 | 自动安装(PEP 723 内联依赖) |
rapidocr-onnxruntime | ≥ 1.0 | pip install rapidocr-onnxruntime(仅 OCR 去重需要) |
与其他技能配合
pdf:输出帧可组装为 PDF 证据包
paddle-ocr:需要更高质量的 OCR 内容识别时,用输出帧作为输入
legal-text-format:帧内容 OCR 后格式化
video-compressor:抽帧前先压缩视频,减小 I/O 时间
硬约束
- 不修改原视频文件
- 输出图片使用 JPEG 格式,最长边不超过
--max-size 参数
_report.json 始终生成,确保证据可追溯