원클릭으로 Manus에서 모든 스킬 실행

paddle-ocr

面向法律 PDF 与扫描件的 PaddleOCR 结构化解析技能。默认将本地 PDF 或图片转换为 Markdown，并在技能内部保留可追溯 archive 归档。适用于卷宗、病历、证据材料、发票、财报、复杂扫描件、表格密集文档、公式与多栏版面。触发词包括：法律 PDF OCR、卷宗 OCR、病历 OCR、证据扫描件转 Markdown、PaddleOCR、表格识别、公式识别、版面分析、PDF 转 Markdown、复杂 PDF 解析。

Manus에서 실행

스타352

포크53

업데이트2026년 6월 8일 15:55

출처

cat-xierluo

cat-xierluo/legal-skills

GitHub 저장소 열기 Creator 저장소 보기

설치 명령

다운로드

Manus에서 실행

관련 직업SOC

SOC 직업 분류 기준

변호사법률직·SOC 23-1011

법률 보조사SOC 23-2011

파일 탐색기

14 개 파일

SKILL.md

readonly

이 저장소의 다른 Skills

같은 저장소

article2book

cat-xierluo/legal-skills

基于现有文章、专栏、课程讲稿、逐字稿、访谈、课件、会议纪要、案例材料、PDF 文本、Word 文档和笔记等内容资产，判断它们最适合转化为书、小册子、课程、系列文章、实务手册或知识库，并输出精简策划意见；用户提到“把现有内容整理成书”“判断素材适合做书还是课程”“把文章/直播稿/课程稿/笔记重组成知识产品”等场景时，应使用本技能。

2026-06-16352

funasr-transcribe

cat-xierluo/legal-skills

使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件，支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。

2026-06-16352

git-workflow

cat-xierluo/legal-skills

Git 工作流安全助手。本技能应在需要执行分支管理、Monorepo 安全合并、PR 创建/审查/合并、冲突处理、cherry-pick、安全回退，以及 stale/已合并分支审计与清理（branch cleanup，含 squash/rebase merge 校验）时使用。不要用于：批量生成提交信息、项目任务分配、长期任务状态管理或本地多 Agent 会话编排。

2026-06-16352

legal-ocr

cat-xierluo/legal-skills

本技能应在用户需要 OCR、扫描识别、图片文字识别、文档识别，或将 PDF、图片、Office 文档、URL 转换为 Markdown 时使用。检测到法律材料时可进行保守的法律术语与文书结构优化。不要用于法律事实判断、补写缺失内容、语义改写、印章深度识别或图表实体分析。

2026-06-16352

skill-lint

cat-xierluo/legal-skills

Skill 质量验收与格式审查工具，也可称 Skilllint。本技能应在用户需要审查 Claude Code Skill 的目录结构、Frontmatter、引用一致性、发布版本、业务流深度、可评估性和安全风险时使用。不要用于：创建新技能、代码审查、应用功能测试、通用编程任务。

2026-06-16352

transcription-corrector

cat-xierluo/legal-skills

转录稿纠错与轻度优化。本技能应在用户需要按用户词典纠正 ASR 转录稿同音字与英文专有名称漂移时使用。不要用于：重写为课程章节、报告、总结，或完全空白的素材创作。

2026-06-16352

name	paddle-ocr
description	面向法律 PDF 与扫描件的 PaddleOCR 结构化解析技能。默认将本地 PDF 或图片转换为 Markdown，并在技能内部保留可追溯 archive 归档。适用于卷宗、病历、证据材料、发票、财报、复杂扫描件、表格密集文档、公式与多栏版面。触发词包括：法律 PDF OCR、卷宗 OCR、病历 OCR、证据扫描件转 Markdown、PaddleOCR、表格识别、公式识别、版面分析、PDF 转 Markdown、复杂 PDF 解析。
version	1.1.1
license	MIT
author	杨卫薪律师（微信ywxlaw）

PaddleOCR 法律 PDF 转 Markdown

本技能服务于法律材料 OCR。默认目标不是返回一段临时文本，而是：

将本地 PDF / 图片转换为可继续编辑和分析的 Markdown。
在 archive/ 下保留完整归档，便于复核、追溯和二次处理。

何时使用

在以下场景使用本技能：

需要把卷宗、病历、证据材料、法院通知、财报、票据等扫描 PDF 转成 Markdown。
文档包含表格、印章、页眉页脚、多栏排版、公式或复杂版面。
希望保留一个技能内的 archive，沉淀原文件、Markdown、结构化 JSON 和批次结果。
后续还要继续做法律分析、证据摘录、知识入库或 RAG 切片。

在以下场景不要优先使用本技能：

只是快速读取一小段清晰文本，且不需要 Markdown 和归档。
只是截图抄字，速度比结构化质量更重要。
输入不是 PDF / 常见图片格式。

主产出

默认主产出只有两类：

Markdown 文件：保存在源文件同目录，默认与原文件同名、扩展名为 .md
archive 归档目录：保存在 paddle-ocr/archive/时间戳_文件名/

archive 默认包含：

原始输入文件副本
最终 result.md
最终 result.json
批次级 batches/*.json
提取出的图片资源
metadata.json

依赖

系统依赖

依赖	安装方式
`python3`	macOS 通常已内置
`uv`	macOS: `brew install uv`

Python 包

脚本使用 uv run 执行，依赖写在脚本头部，无需单独维护 requirements.txt。

首次配置

获取 API 信息

打开 PaddleOCR 官网
进入对应模型的 API 页面
在示例代码中复制：
- API_URL
- Access Token

配置方式

优先编辑 config/.env：

cd paddle-ocr/config
cp .env.example .env
nano .env

必填项：

PADDLEOCR_DOC_PARSING_API_URL
PADDLEOCR_ACCESS_TOKEN

常用命令

主工作流：生成 Markdown + archive

在技能根目录运行：

uv run scripts/convert.py "/path/to/legal-document.pdf"

或继续兼容旧入口：

/usr/bin/osascript -l JavaScript scripts/convert.js "/path/to/legal-document.pdf"

可选参数：

uv run scripts/convert.py "/path/to/legal-document.pdf" --pages "1-20"
uv run scripts/convert.py "/path/to/legal-document.pdf" --output "/tmp/output.md"
uv run scripts/convert.py "/path/to/legal-document.pdf" --archive-name "某案卷宗-证据一"

底层调试：只调用解析接口，输出结构化 JSON

uv run scripts/layout_caller.py --file-path "/path/to/legal-document.pdf" --pretty
uv run scripts/layout_caller.py --file-url "https://example.com/document.pdf" --stdout --pretty

当你只想检查原始接口结果，或后续要自己解析表格/坐标信息时，使用这个底层脚本。

自检

uv run scripts/smoke_test.py --skip-api-test
uv run scripts/smoke_test.py

拆分页码

uv run scripts/split_pdf.py input.pdf output.pdf --pages "1-5,8,10-12"

法律 PDF 工作流

按以下顺序工作：

优先使用 scripts/convert.py。
如只需部分页码，先传 --pages，避免整卷上传。
对大体量卷宗，脚本会按配置自动分批请求，再合并为一个 Markdown。
需要复核时，到 archive/ 查看：
- output/result.md
- output/result.json
- metadata.json
- batches/*.json

大文件策略

本技能为了法律材料的稳定性，默认采用保守批次策略：

PDF 页数超过 PADDLEOCR_BATCH_PAGES 时自动分批
预估 Base64 大小超过 PADDLEOCR_MAX_BASE64_MB 时自动分批

这意味着它可能比官方上限更早拆分，但通常能降低长卷宗、病历合并件和扫描质量不稳定文档的失败率。

输出说明

Markdown

默认保存到源文件同目录
如果传 --output 且是 .md 文件路径，则保存到指定路径
如果 --output 是目录，则在该目录下生成同名 .md

配置项

编辑 config/.env：

选项	默认值	说明
`PADDLEOCR_DOC_PARSING_API_URL`	空	官方要求的完整 `layout-parsing` 端点
`PADDLEOCR_ACCESS_TOKEN`	空	官方 Access Token
`PADDLEOCR_DOC_ORIENTATION`	`false`	是否启用方向分类
`PADDLEOCR_DOC_UNWARP`	`false`	是否启用去扭曲
`PADDLEOCR_CHART_RECOG`	`false`	是否启用图表识别
`PADDLEOCR_DOC_PARSING_TIMEOUT`	`600`	单次请求超时秒数
`PADDLEOCR_BATCH_PAGES`	`40`	PDF 自动分批页数阈值兼批次大小
`PADDLEOCR_MAX_BASE64_MB`	`20`	触发分批的保守大小阈值
`PADDLEOCR_LOG_LEVEL`	`medium`	`low` / `medium` / `high`

结果结构

如果需要理解底层 JSON 包装格式，读取：

references/output_schema.md

故障排除

问题	解决方式
未配置 API	先补 `config/.env`，再执行 `uv run scripts/smoke_test.py --skip-api-test`
403 / Token 错误	更新 `PADDLEOCR_ACCESS_TOKEN`
请求超时	调大 `PADDLEOCR_DOC_PARSING_TIMEOUT`，或减少页码范围
大 PDF 失败	使用 `--pages` 缩小范围，或让脚本自动分批
Markdown 为空	到 `archive/` 查看 `batches/*.json` 和 `metadata.json`，确认是否原文件质量过差
需要看原始坐标和表格结构	使用 `scripts/layout_caller.py`，并读取 `result.result.layoutParsingResults[*].prunedResult`

整合路线图

本技能将与 mineru-ocr 整合为统一的 legal-ocr Skill，支持双后端（PaddleOCR + MinerU）、自动路由和法律后处理管线。

完整规划见 docs/ROADMAP_LEGAL_OCR.md。

维护建议

修改本技能后，同步更新：

TASKS.md
DECISIONS.md
CHANGELOG.md