con un clic
byted-las-pdf-parse-doubao
// PDF 解析(Doubao):将 PDF/扫描件转成结构化 Markdown/文本,支持表格与多栏版式。当用户要从 PDF 提取文字/表格或做 OCR 时触发。
// PDF 解析(Doubao):将 PDF/扫描件转成结构化 Markdown/文本,支持表格与多栏版式。当用户要从 PDF 提取文字/表格或做 OCR 时触发。
增强语音识别(ASR Pro):将音频/视频转写为文本,支持降噪、说话人分离等增强分析。当用户要转写录音/视频、生成字幕、区分说话人或做语音增强分析时触发。
从视频提取音轨,并按时长/规则切分音频。当用户要从视频提取音频,或把长音频分段(切片/分片)时触发。
智能视频剪辑:用自然语言描述要保留的片段/人物/事件,自动从长视频抽取剪辑(可用参考图做人物/物体匹配)。当用户要按描述找片段、提取高光或做智能剪辑时触发。
视频多模态理解:对视频生成描述/摘要/标签,并支持基于视频内容问答。当用户要理解视频内容、生成描述或对视频提问时触发。
火山引擎云监控技能,用于查询云资源的监控时序数据。
byted-emr-skills提供管理火山引擎EMR(火山引擎 E-MapReduce(简称“EMR”)是开源Hadoop生态的企业级大数据分析系统,完全兼容开源)的技能,包括管理EMR on ECS集群、EMR on VKE集群、EMR serverless队列、计算组、作业模板/实例、日志、监控并提供 EMR Agent 智能诊断与知识问答能力。当用户提及“EMR on ECS集群”、“EMR on VKE集群”、“Serverless 队列”、“Serverless 作业”、“SparkSQL/PrestoSQL/Ray/PySpark/SparkJar 作业”、“作业日志”、“作业监控”、“作业诊断”等需求时,应优先使用此技能。
| name | byted-las-pdf-parse-doubao |
| version | 0.3.8 |
| description | PDF 解析(Doubao):将 PDF/扫描件转成结构化 Markdown/文本,支持表格与多栏版式。当用户要从 PDF 提取文字/表格或做 OCR 时触发。 |
| metadata | {"category":"productivity","lasCliVersion":"0.3.8","requires":{"bins":["las-cli"]},"cliHelp":"las-cli operators help las_pdf_parse_doubao","operatorId":"las_pdf_parse_doubao","openclaw":{"identity":[{"type":"tip","env":["VE_TIP_TOKEN"],"required":true}]}} |
las_pdf_parse_doubao)当用户希望从 PDF/图片中提取文本、表格、段落等结构化内容时使用本 Skill。
las-cli tos download 命令(兼容 tos 和非 tos 资源)。las-cli operators call 和 las-cli price 命令的输出结果非常重要,必须完整返回给用户。复制此清单并跟踪进度:
执行进度:
- [ ] Step 0: 前置检查
- [ ] Step 1: 初始化与准备
- [ ] Step 2: 预估价格
- [ ] Step 3: 执行任务并呈现结果
- [ ] Step 4: 失败排查
版本检查(必须):请执行 las-cli install 0.3.8。若 las-cli 命令不存在,则执行 npm i -g "@volcengine/las-cli@0.3.8"
npm info @volcengine/las-cli version 查看当前可用的最新 Skill 版本(las-cli 与 Skill 版本一一对应)。若返回版本高于本 Skill 标注版本,请先提示用户升级当前 Skill。升级方式:请用户发送自然语言指令 帮我安装byted-las-pdf-parse-doubao技能,等待自动完成安装即可。las-cli config show 确认旧版凭证 las.apiKey 和 volcengine.region 已配置。上传资源: 若输入为本地文件,先上传到 TOS。
las-cli tos upload ./document.pdf
# 假设返回 "tos_url": "tos://my-bucket/inputs/xxx.pdf"
准备参数: 创建 params.json。
{
"url": "tos://my-bucket/inputs/xxx.pdf",
"output_tos_path": "tos://my-bucket/outputs/pdf_parse/",
"parse_mode": "normal",
"start_page": 1,
"num_pages": 200,
"full_result": true,
"aspect_ratio_threshold": 0.334
}
说明:
output_tos_path:可选。填写后会把解析结果产物写到该目录(推荐),典型结构:{output_tos_path}/{task_id}/result.md、result_preview.md、images/、detail.json。parse_mode:normal(默认)/ detail(更细,通常更贵)。start_page / num_pages:仅 PDF 有效;num_pages 默认 200,最大 400。full_result:true 返回完整解析结果;false 仅返回产物信息(结果较大时建议关掉,并配合 output_tos_path)。las-cli price 命令的输出结果非常重要,不要做任何精简、修改或摘要处理。
las-cli price las_pdf_parse_doubao \
--params-file ./params.json \
--format markdown
las-cli operators call 命令的输出结果非常重要,不要做任何精简、修改或摘要处理。
las-cli operators call las_pdf_parse_doubao \
--params-file ./params.json \
--format markdown \
--out ./result.md
las-cli task status <task_id>。url 可访问;若是 tos://,先用 las-cli tos check "<tos_url>" 验证。output_tos_path,确保是 tos://bucket/prefix/ 目录形式。las-cli config show。