增强语音识别(ASR Pro):将音频/视频转写为文本,支持降噪、说话人分离等增强分析。当用户要转写录音/视频、生成字幕、区分说话人或做语音增强分析时触发。
从视频提取音轨,并按时长/规则切分音频。当用户要从视频提取音频,或把长音频分段(切片/分片)时触发。
PDF 解析(Doubao):将 PDF/扫描件转成结构化 Markdown/文本,支持表格与多栏版式。当用户要从 PDF 提取文字/表格或做 OCR 时触发。
智能视频剪辑:用自然语言描述要保留的片段/人物/事件,自动从长视频抽取剪辑(可用参考图做人物/物体匹配)。当用户要按描述找片段、提取高光或做智能剪辑时触发。
视频多模态理解:对视频生成描述/摘要/标签,并支持基于视频内容问答。当用户要理解视频内容、生成描述或对视频提问时触发。
火山引擎云监控技能,用于查询云资源的监控时序数据。
byted-emr-skills提供管理火山引擎EMR(火山引擎 E-MapReduce(简称“EMR”)是开源Hadoop生态的企业级大数据分析系统,完全兼容开源)的技能,包括管理EMR on ECS集群、EMR on VKE集群、EMR serverless队列、计算组、作业模板/实例、日志、监控并提供 EMR Agent 智能诊断与知识问答能力。当用户提及“EMR on ECS集群”、“EMR on VKE集群”、“Serverless 队列”、“Serverless 作业”、“SparkSQL/PrestoSQL/Ray/PySpark/SparkJar 作业”、“作业日志”、“作业监控”、“作业诊断”等需求时,应优先使用此技能。
官方Viking CLI 命令行助手:本CLI覆盖火山引擎/BytePlus VikingDB(向量库)/Knowledge(知识库)/Memory(记忆库)的数据集管理和数据的读写及检索, 可用于扩展Agent的知识检索边界 提升Agent的记忆能力; 当用户对知识库/向量库提问时,使用本Skill; 当用要操作向量库/知识库 或 从向量库/知识库检索信息时使用本Skill; 当用户要记忆检索和记忆存储时,使用本Skill。