com um clique
volc-asr
// 火山引擎音视频转写 + 口播自动粗剪 skill。用于语音转文字、视频转文字、音频识别、生成时间戳/SRT 字幕,也用于帮我剪口播、自动粗剪、删重复、删停顿、删口误、生成粗剪 MP4。 触发场景:用户说"帮我转写这个视频"、"音视频转文字"、"识别这个音频"、"帮我剪口播"、"自动剪辑"时使用。
// 火山引擎音视频转写 + 口播自动粗剪 skill。用于语音转文字、视频转文字、音频识别、生成时间戳/SRT 字幕,也用于帮我剪口播、自动粗剪、删重复、删停顿、删口误、生成粗剪 MP4。 触发场景:用户说"帮我转写这个视频"、"音视频转文字"、"识别这个音频"、"帮我剪口播"、"自动剪辑"时使用。
抖音视频下载工具。使用 Playwright 拦截 Network 响应提取无水印直链并下载。 触发词:「下载抖音视频」「抓取抖音」「douyin」「帮我下载这个抖音」
当用户让 Codex 操作剪映/CapCut 桌面端、导入视频/音频素材、把素材放入时间线、在剪映内手动剪辑或精修、添加字幕、导出视频,或要求边操作剪映边记录项目日志时使用。
抓取小红书笔记(视频/图文)并按指令沉淀到飞书多维表格。视频笔记→视频对标库(含ASR转写+LLM分段);图文笔记→社媒爆款选题库(默认)或指定表格。触发:沉淀/入库/保存+小红书链接,或直接发送小红书链接+说明意图。
对标视频内容拆解。输入视频口播稿,输出逐句作用拆解 + 问题诊断 + 可模仿报告。 触发方式:/yichen-video-content、「拆解这个视频」、「分析对标内容」
微信 Mac 4.x 本地数据库全量/增量解析与数字资产库。用于本机微信聊天记录、联系人、群聊、朋友圈、收藏夹、语音/附件索引的密钥提取、全量解密、增量刷新、指定联系人/群聊导出、关系复盘、客户跟进和内容沉淀。触发词:微信解析、微信全量、微信增量、聊天记录、导出聊天、朋友圈解析、收藏夹解析、客户跟进、wechat-local-vault。
将 Obsidian 或本地 Markdown 文章上传到 X/Twitter Articles 草稿,自动把第一张图作为封面,并按原文位置插入所有正文图片。适用于用户要求上传、发布、保存 Markdown 到 X Article,尤其是需要复用 Chrome 登录态、使用独立 Playwright 浏览器、不接管用户当前浏览器、封面必须是最上方图片,或旧脚本出现缺图、错位、MPH_MARKER 等残留时。
| name | volc-asr |
| description | 火山引擎音视频转写 + 口播自动粗剪 skill。用于语音转文字、视频转文字、音频识别、生成时间戳/SRT 字幕,也用于帮我剪口播、自动粗剪、删重复、删停顿、删口误、生成粗剪 MP4。 触发场景:用户说"帮我转写这个视频"、"音视频转文字"、"识别这个音频"、"帮我剪口播"、"自动剪辑"时使用。 |
| triggers | ["/转写","/剪口播","转写视频","转写音频","视频转文字","音频转文字","音视频转写","识别这个视频","识别这个音频","视频识别","音频识别","生成字幕","帮我剪口播","自动剪辑","自动粗剪","删停顿","删口误","删重复"] |
这个 skill 同时负责两类任务:
VOLC_ASR_TRIAL_TOKEN,付费应用使用 VOLC_ASR_PAID_TOKEN 或旧的 VOLC_ASR_TOKEN。在试用包未用完前,不要用付费 token 冒充默认 token。VOLC_ASR_TRIAL_EXHAUSTED=1,也不得让 VOLC_ASR_APP_ID 指向付费应用;如确实要临时绕过,必须明确说明会扣费并获得用户确认。{工作副本}.asr_pending.json / --request-id 恢复查询,避免重复消耗试用时长或余额。# 基础用法:转写 + 分析 + 自动剪辑
python3 volc-asr/scripts/transcribe.py '<工作副本路径>'
# 只看标注不执行剪辑
python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --dry-run
# 忽略 ASR 缓存,重新识别
python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --no-cache
# 不执行 ffmpeg 剪辑,仍生成转写、标注和 SRT
python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --no-execute
# 只转写,不做剪辑分析或生成 SRT
python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --transcribe-only
# 只恢复查询已提交任务,不重新上传/提交
python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --request-id '<火山ASR request_id>' --no-execute
脚本默认使用 VOLC_ASR_TRIAL_APP_ID,并优先读取 VOLC_ASR_TRIAL_TOKEN。只有确认试用/时长包已经用完后,才设置 VOLC_ASR_TRIAL_EXHAUSTED=1,脚本才会切到 VOLC_ASR_PAID_APP_ID 并读取 VOLC_ASR_PAID_TOKEN 或旧的 VOLC_ASR_TOKEN。如确实需要切到其他火山语音应用,先设置 VOLC_ASR_APP_ID;若该应用不是试用包应用且未标记试用已用完,脚本会停止,除非同时显式设置 VOLC_ASR_ALLOW_NON_TRIAL_APP=1。
如果本机旧环境里只有 VOLC_ASR_TOKEN,脚本不会默认把它用于试用应用,避免 token 属于付费应用却误以为在走试用。只有确认 VOLC_ASR_TOKEN 本身就是试用 token 时,才可临时设置 VOLC_ASR_ALLOW_LEGACY_TOKEN=1 兼容旧配置。
脚本会在提交成功后写入 {工作副本}.asr_pending.json,只保存 request_id、AppID、音频 URL 和状态,不保存 token/密钥。复跑时如果没有完成缓存,会优先恢复这个未完成任务;只有明确传 --force-new 才会重新上传并提交新任务。
| 文件 | 说明 |
|---|---|
{工作副本}_cut.mp4 | 粗剪后的视频,可导入剪映 |
{工作副本}_cut.srt | 字幕文件,剪映可导入 |
{工作副本}.txt | 完整转写文字和时间戳 |
{工作副本}.asr_cache.json | ASR 缓存,复跑可复用 |
{工作副本}.asr_pending.json | 未完成ASR任务记录,可用于恢复查询,不能当作完成结果 |
ffprobe 看时长和编码。source_for_asr.mp4。python3 volc-asr/scripts/transcribe.py '<工作副本路径>' --no-execute。当用户要“帮我剪口播”“自动粗剪”“删重复/停顿/口误/断句”时:
.asr_cache.json。KEEP:干净、有信息量、叙事必要的内容。DELETE:口误、重复、长停顿、废句、半句话、无效语气词。CHECK:内容可能有用,但啰嗦或听感不确定。jianying-editor 负责导入、放轨道、视觉精修和导出。| # | 规则 | 说明 |
|---|---|---|
| 1 | 停顿删除 | 相邻片段时间缺口较长的静音可删除 |
| 2 | 纯语气词删除 | 整段仅为嗯、啊、呃、哦等语气词时删除 |
| 3 | 相邻重复删除 | 优先删前保后,灰色地带人工判断 |
| 4 | 句中语气词保留 | 语气词在句子中间时整段保留 |
| 5 | 连续前缀词清理 | 然后、所以、其实、就是说等连续开头时清理冗余 |
| 6 | 短片段谨慎处理 | 非纯语气词短片段默认保留 |
| 7 | 智能 margin | 保留片段前后加缓冲,避免吞字 |
| 8 | Smoothing | 过短保留片段合并到相邻片段,避免闪帧 |
每一层都检查:
删除区间必须对应重复、口误、废句、明显停顿或不可用残句;边界不能切进完整句子中间,除非后面有更干净的完整版本。
粗剪渲染后,对粗剪 MP4 重新转写。成片转写里不能有明显重复、残句、长停顿、逻辑跳跃或硬切造成的句子不完整。
最新版粗剪必须通过一次完整审核后,才能说“可以进入剪映精修”。如果没通过,继续出新版本。
建议用一条人工确认过的粗剪成片作为质量标尺。以后口播粗剪以这个标准为基准:没有重复片段、没有明显停顿、没有把完整句子剪断。