Manusで任意のスキルを実行
ワンクリックで
ワンクリックで
ワンクリックでManusで任意のスキルを実行
始める$pwd:
$ git log --oneline --stat
stars:26
forks:2
updated:2026年2月2日 02:39
SKILL.md
| name | mineru-converter |
| description | PDF转Markdown工具,基于MinerU和方案A++策略,完全封装的CLI工具+Skill,自动清理临时文件,支持单文件和批量处理 |
用户: "处理这个PDF文件" Claude: [自动调用mineru-cli,处理完成后清理临时文件]
# 直接调用Skill中的CLI
/Users/CS/.claude/skills/mineru-converter/bin/mineru-cli convert file.pdf -o output/
# 或创建符号链接后简化调用
mineru-cli convert file.pdf -o output/
✅ 完全封装:CLI工具集成在Skill目录内,零外部依赖 ✅ 方案A++策略:每文件独立进程,自动内存释放 ✅ 自动清理:只保留最终MD文件,临时文件自动删除 ✅ 灵活输出:可指定输出目录,默认为PDF所在目录 ✅ 错误重试:自动重试3次,提高成功率 ✅ 进度监控:实时反馈处理状态和性能指标
/Users/CS/.claude/skills/mineru-converter/bin/mineru-cli(集成在skill内)lib/*.sh(processor.sh, cleanup.sh, validator.sh, logger.sh)env/mineru_venv/(封装在skill内)scripts/*.sh(封装在skill内)mineru-converter/
├── SKILL.md # 本文件
├── README.md # 详细使用文档
├── bin/
│ └── mineru-cli # CLI主入口
├── lib/ # 核心库
│ ├── processor.sh # 核心处理逻辑
│ ├── cleanup.sh # 清理工具
│ ├── validator.sh # 文件验证
│ └── logger.sh # 日志管理
├── env/
│ └── mineru_venv/ # Python虚拟环境(封装)
├── scripts/ # 参考脚本(封装)
│ ├── batch_mineru_safe.sh
│ ├── batch_mineru_medium.sh
│ └── batch_mineru_mild.sh
├── config/
│ └── default.conf # 默认配置
└── references/ # 参考资料
└── mineru-official-docs.md
# 创建符号链接到PATH(推荐)
ln -s /Users/CS/.claude/skills/mineru-converter/bin/mineru-cli \
/usr/local/bin/mineru-cli
# 验证安装
mineru-cli --version
mineru-cli <command> [options]
# 单文件处理
mineru-cli convert path/to/file.pdf
# 指定输出目录
mineru-cli convert path/to/file.pdf -o path/to/output/
# 批量处理
mineru-cli convert path/to/*.pdf
# 完整参数示例
mineru-cli convert path/to/file.pdf \
--output path/to/output/ \
--gpu \
--vram 1024 \
--cleanup \
--retry 3 \
--verbose
# 处理整个目录
mineru-cli batch path/to/pdfs/
# 自动跳过已完成文件
mineru-cli batch path/to/pdfs/ --resume
# 并发处理(谨慎使用)
mineru-cli batch path/to/pdfs/ --jobs 2
# 清理所有临时文件
mineru-cli clean --all
# 清理指定工作空间
mineru-cli clean --workspace 20260201_143022
# 只清理日志
mineru-cli clean --logs-only
# 查看处理进度
mineru-cli status
# 查看系统资源使用
mineru-cli status --resources
| 参数 | 说明 | 默认值 |
|---|---|---|
-o, --output | 输出目录 | PDF文件所在目录 |
--gpu | 启用GPU加速 | 关闭 |
--vram | GPU显存(MB) | 1024 |
--cleanup | 自动清理临时文件 | 开启 |
--retry | 失败重试次数 | 3 |
--verbose | 详细日志输出 | 关闭 |
--jobs | 批量并发数 | 1(推荐) |
核心特点:
性能数据:
与原串行方案对比:
| 指标 | 原串行方案 | 方案A++ | 提升 |
|---|---|---|---|
| 处理速度 | 51页/分钟 | 150页/分钟 | 3x |
| 总耗时(20文件) | 218分钟 | 70-75分钟 | -65% |
| 内存释放 | 手动重启 | 自动释放 | ∞ |
| 目录整洁度 | 临时文件残留 | 自动清理 | ∞ |
# 最简单用法(输出到当前目录)
mineru-cli convert report.pdf
# 输出到指定目录
mineru-cli convert report.pdf -o ~/Documents/markdown/
# 处理目录下所有PDF(自动跳过已完成的)
mineru-cli batch /path/to/pdfs/ --resume
# 查看当前处理进度
mineru-cli status
# 查看系统资源使用
mineru-cli status --resources
# 清理所有临时文件
mineru-cli clean --all
工具内置智能错误处理:
# 检查CPU使用率
top -l 1 | grep mineru
# 解决方案:关闭GPU加速
mineru-cli convert file.pdf --no-gpu
# 检查临时目录大小
du -sh .mineru_temp/
# 清理所有临时文件
mineru-cli clean --all
# 单独重试失败文件
mineru-cli convert failed_file.pdf --retry 5
# 使用--resume继续处理
mineru-cli batch /path/to/pdfs/ --resume
# 一键健康检查脚本
mineru-cli healthcheck
输出示例:
=== MinerU工具健康检查 ===
1️⃣ 虚拟环境: ✅ 存在
2️⃣ CLI工具: ✅ 已安装
3️⃣ 临时目录: ✅ 干净
4️⃣ 系统资源:
- 可用内存: 18GB
- CPU使用率: 12%
5️⃣ 运行进程: ✅ 无(已清理)
=== 检查完成 ===
references/mineru-official-docs.mdscripts/batch_mineru_safe.sh(方案A++)config/default.conf