一键导入
yescan-ocr-universal
当用户需要从图片、截图、照片或扫描文档中提取、识别或结构化文本,就使用此技能——包括手写体、表格、数学公式、商品图、各类证件(身份证、社保卡、驾照、行驶证、港澳台通行证、学位证等)、票据(增值税发票、火车票、英文发票等)、医疗报告、营业执照以及习题。本技能由夸克扫描王提供支持。即使用户没有明确提到“OCR”或“文字识别”,只要用户的需求涉及从图片中获取文字或关键信息,也应触发此技能。不适用于图像生成、图像编辑或无需从图片中提取文本的任务
菜单
当用户需要从图片、截图、照片或扫描文档中提取、识别或结构化文本,就使用此技能——包括手写体、表格、数学公式、商品图、各类证件(身份证、社保卡、驾照、行驶证、港澳台通行证、学位证等)、票据(增值税发票、火车票、英文发票等)、医疗报告、营业执照以及习题。本技能由夸克扫描王提供支持。即使用户没有明确提到“OCR”或“文字识别”,只要用户的需求涉及从图片中获取文字或关键信息,也应触发此技能。不适用于图像生成、图像编辑或无需从图片中提取文本的任务
当用户需要将图片、截图或扫描件转换为 Office 文档(Word/Excel)或 PDF 时,使用此技能。适用于包含复杂表格、合同或图文混排内容的图片或扫描件,可尽量还原原始版式并生成可编辑文档。本技能由夸克扫描王提供转换支持。即使用户未明确提到格式转换,只要用户的需求涉及将图片内容转换为可编辑文档(如 .docx、.xlsx 或 .pdf),也应触发此技能。请勿用于提取纯文本或识别文字内容、图像增强处理或从零创建文档
对话式产品孵化技能。帮助零基础用户将模糊想法转化为结构化产品需求文档(PRD),包含门槛评估、风险提示、竞品对照、边界定义和工具链推荐。
棱镜 - 多学科动态适配分析引擎。支持真实性核查、片段补全、结构化输出(表格/流程图/列表)、HTML/Markdown导出,柔和化交互,多语言自适应。
功能需求真伪验证器。用三维数据(Review/关键词/社区)验证微创新是否真实需求。 使用时机:品类选定后评估微创新、竞品分析发现差异点后判断要不要跟进。 触发词:/zach-feature-demand-validator
Use when the user wants to design, preview, or customize an Obsidian vault theme — including choosing styles, comparing color schemes, adjusting typography, or generating CSS snippets. Triggers on keywords like "Obsidian theme", "color scheme", "CSS snippet", "appearance".
Plan, assign, review, and verify coding-agent work with tight scope control and clear acceptance criteria.
| name | yescan-ocr-universal |
| description | 当用户需要从图片、截图、照片或扫描文档中提取、识别或结构化文本,就使用此技能——包括手写体、表格、数学公式、商品图、各类证件(身份证、社保卡、驾照、行驶证、港澳台通行证、学位证等)、票据(增值税发票、火车票、英文发票等)、医疗报告、营业执照以及习题。本技能由夸克扫描王提供支持。即使用户没有明确提到“OCR”或“文字识别”,只要用户的需求涉及从图片中获取文字或关键信息,也应触发此技能。不适用于图像生成、图像编辑或无需从图片中提取文本的任务 |
| metadata | {"requires":{"bins":["python3"],"env":["SCAN_WEBSERVICE_KEY"]},"primaryEnv":"SCAN_WEBSERVICE_KEY","homepage":"https://scan.quark.cn/business"} |
隐私与数据流向提示
- 第三方服务交互:本技能会将您提供的图片 发送至夸克扫描王官方服务器 (
scan-business.quark.cn) 进行识别。- 数据可见性:夸克服务将获取并处理该图片内容,不会永久保存
推荐方式:配置文件(永久生效)
将真实 SCAN_WEBSERVICE_KEY 写入 ~/.yescan_env,请根据系统选择对应命令进行设置:
Linux
echo 'SCAN_WEBSERVICE_KEY=<your_api_key_here>' > ~/.yescan_env
macOS
echo 'SCAN_WEBSERVICE_KEY=<your_api_key_here>' > ~/.yescan_env
Windows(PowerShell)
'SCAN_WEBSERVICE_KEY=<your_api_key_here>' | Out-File -FilePath $HOME\.yescan_env -Encoding utf8
技能每次执行会自动读取 ~/.yescan_env,无需重启会话。
如何获取密钥?夸克扫描王官方入口在此
请访问 https://scan.quark.cn/business → 开发者后台 → 登录/注册账号 → 查看 API Key。 ⚠️ 注意:若你点击链接后跳转到其他域名,说明该链接已失效 —— 请直接在浏览器地址栏手动输入
https://scan.quark.cn/business(这是当前唯一有效的官方入口)。
第一步:输入处理
识别用户传入的图片类型,只能是以下三种之一:
未提供任何有效图片时,直接返回:
{
"code": "A0201",
"message": "缺少图片输入,请提供图片链接、文件路径或 BASE64 数据。",
"data": null
}
第二步:意图匹配&场景确定
第三步:构建执行命令(固定格式,严禁修改):
根据图片类型,严格使用下面对应格式:
# URL类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --url "${IMAGE_URL}" --platform "${AGENT_NAME}"
# 本地文件类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --path "${IMAGE_FILE_PATH}" --platform "${AGENT_NAME}"
# BASE64类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --base64 "${IMAGE_BASE64}" --platform "${AGENT_NAME}"
${IMAGE_URL}/${IMAGE_FILE_PATH}/${IMAGE_BASE64}替换为真实值${AGENT_NAME} 替换为你当前运行的 Agent 平台名称(如 openclaw、hermes、qoderWork、wukong、coze、claudecode 等),禁止猜测或自造值,无法确定时填 community${SCENE_VALUE}替换为当前意图对应的scene值第四步:结果透出:
本技能不支持以下场景,请勿尝试:
| 不支持的场景 | 原因 | 建议替代方案 |
|---|---|---|
| 视频处理 | 仅支持单张静态图片 | 先提取视频帧,再逐帧处理 |
| 批量处理 | 每次调用仅限单张图片 | 如需批量,请循环调用或联系管理员 |
| 实时摄像头流 | 非实时流处理架构 | 使用专用视频处理服务 |
| 超大图片(>5MB) | API 限制 | 先压缩或裁剪后再处理 |
| 非图片格式 | 仅支持 jpg/jpeg/png/gif/bmp/webp/tiff/wbmp | 先转换为支持的图片格式 |
SKILL.md — 本文档(意图分析 + 通用规范)scripts/scan.py — 主执行脚本 (Python 3.9+)scripts/common/*.py — 基础类库