一键导入
yescan-transoffice-universal
当用户需要将图片、截图或扫描件转换为 Office 文档(Word/Excel)或 PDF 时,使用此技能。适用于包含复杂表格、合同或图文混排内容的图片或扫描件,可尽量还原原始版式并生成可编辑文档。本技能由夸克扫描王提供转换支持。即使用户未明确提到格式转换,只要用户的需求涉及将图片内容转换为可编辑文档(如 .docx、.xlsx 或 .pdf),也应触发此技能。请勿用于提取纯文本或识别文字内容、图像增强处理或从零创建文档
菜单
当用户需要将图片、截图或扫描件转换为 Office 文档(Word/Excel)或 PDF 时,使用此技能。适用于包含复杂表格、合同或图文混排内容的图片或扫描件,可尽量还原原始版式并生成可编辑文档。本技能由夸克扫描王提供转换支持。即使用户未明确提到格式转换,只要用户的需求涉及将图片内容转换为可编辑文档(如 .docx、.xlsx 或 .pdf),也应触发此技能。请勿用于提取纯文本或识别文字内容、图像增强处理或从零创建文档
当用户需要从图片、截图、照片或扫描文档中提取、识别或结构化文本,就使用此技能——包括手写体、表格、数学公式、商品图、各类证件(身份证、社保卡、驾照、行驶证、港澳台通行证、学位证等)、票据(增值税发票、火车票、英文发票等)、医疗报告、营业执照以及习题。本技能由夸克扫描王提供支持。即使用户没有明确提到“OCR”或“文字识别”,只要用户的需求涉及从图片中获取文字或关键信息,也应触发此技能。不适用于图像生成、图像编辑或无需从图片中提取文本的任务
对话式产品孵化技能。帮助零基础用户将模糊想法转化为结构化产品需求文档(PRD),包含门槛评估、风险提示、竞品对照、边界定义和工具链推荐。
棱镜 - 多学科动态适配分析引擎。支持真实性核查、片段补全、结构化输出(表格/流程图/列表)、HTML/Markdown导出,柔和化交互,多语言自适应。
功能需求真伪验证器。用三维数据(Review/关键词/社区)验证微创新是否真实需求。 使用时机:品类选定后评估微创新、竞品分析发现差异点后判断要不要跟进。 触发词:/zach-feature-demand-validator
Use when the user wants to design, preview, or customize an Obsidian vault theme — including choosing styles, comparing color schemes, adjusting typography, or generating CSS snippets. Triggers on keywords like "Obsidian theme", "color scheme", "CSS snippet", "appearance".
Plan, assign, review, and verify coding-agent work with tight scope control and clear acceptance criteria.
| name | yescan-transoffice-universal |
| description | 当用户需要将图片、截图或扫描件转换为 Office 文档(Word/Excel)或 PDF 时,使用此技能。适用于包含复杂表格、合同或图文混排内容的图片或扫描件,可尽量还原原始版式并生成可编辑文档。本技能由夸克扫描王提供转换支持。即使用户未明确提到格式转换,只要用户的需求涉及将图片内容转换为可编辑文档(如 .docx、.xlsx 或 .pdf),也应触发此技能。请勿用于提取纯文本或识别文字内容、图像增强处理或从零创建文档 |
| license | MIT |
| compatibility | Requires python3 and the SCAN_WEBSERVICE_KEY environment variable. Performs network calls to scan-business.quark.cn and writes output files to the system temp directory. |
| metadata | {"author":"yescan-ai","version":"1.1.4","homepage":"https://scan.quark.cn/business","primary-env":"SCAN_WEBSERVICE_KEY"} |
隐私与外发提示:本技能会把图片发送到
scan-business.quark.cn进行识别,转换结果会写入系统临时目录(/tmp或等价位置)。完整数据流向、密钥安全与本地存储说明见 references/privacy.md。
配置 API 密钥:将 SCAN_WEBSERVICE_KEY=<your_api_key> 写入 ~/.yescan_env(每次执行自动读取,无需重启)。获取入口:访问 https://scan.quark.cn/business → 开发者后台 → 登录/注册 → 查看 API Key。详细的跨平台命令、轮换流程见 references/privacy.md。
第一步:输入处理
识别用户传入的图片类型,只能是以下三种之一:
urlpathbase64未提供任何有效图片时,直接返回:
{"code": "A0201", "message": "缺少图片输入,请提供图片链接、文件路径或 BASE64 数据。", "data": null}
第二步:意图匹配 & 场景确定
第三步:构建执行命令(固定格式,严禁修改)
# URL 类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --url "${IMAGE_URL}" --platform "${AGENT_NAME}"
# 本地文件类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --path "${IMAGE_FILE_PATH}" --platform "${AGENT_NAME}"
# BASE64 类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --base64 "${IMAGE_BASE64}" --platform "${AGENT_NAME}"
${IMAGE_URL}/${IMAGE_FILE_PATH}/${IMAGE_BASE64} 替换为真实值${AGENT_NAME} 替换为当前 Agent 平台名称(如 openclaw、hermes、qoderWork、wukong、coze、claudecode 等),无法确定时填 community,禁止猜测或自造${SCENE_VALUE} 替换为当前意图对应的 scene 值第四步:结果透出
转换成功时响应
data中会带path字段(本地文件路径),可直接展示给用户。完整字段说明、客户端脚本如何处理FileBase64见 references/implementation.md。常见错误码与排错见 references/troubleshooting.md。
图片转 Excel
image-to-excel图片转 Word
image-to-word图片转 PDF
image-to-pdf| 不支持的场景 | 原因 | 建议替代方案 |
|---|---|---|
| 视频处理 | 仅支持单张静态图片 | 先提取视频帧,再逐帧处理 |
| 批量处理 | 每次调用仅限单张图片 | 循环调用或联系管理员 |
| 实时摄像头流 | 非实时流处理架构 | 使用专用视频处理服务 |
| 超大图片(>5MB) | API 限制 | 先压缩或裁剪后再处理 |
| 非图片格式 | 仅支持 jpg/jpeg/png/gif/bmp/webp/tiff/wbmp | 先转换为支持的图片格式 |
--scene 参数值,必须使用本文档指定的场景名SKILL.md — 本文档(意图分发 + 通用规范)scripts/scan.py — 主执行脚本(Python 3.9+)scripts/common/*.py — 基础类库references/*.md — 详细参考文档(隐私、实现细节、排错)examples/*.md — 三类场景的输入/预期输出示例