| name | doc-format |
| description | 公文格式排版工具。将 doc/docx/wps/txt/md 文档按照公文排版习惯自动格式化,输出标准 docx。支持智能识别标题层级(一、/(一)/1./(1))、题目/副标题、附件格式化、图表标题识别、页面边距、页码、行距、字体字号、TXT/MD 空行模式、自定义配置和目录批量处理。当用户需要排版公文、格式化文档、统一文档格式、调整字体字号行距边距时使用此技能。关键词:公文排版、文档格式化、字体设置、标题层级、格式统一、排版工具。 |
doc-format — 公文格式排版工具
使用 scripts/wfp_cli.py 将文档按公文排版规则格式化为标准 .docx。原始文件不原地修改,Word/WPS 类文档会先复制或转换到临时副本,再执行排版。
核心能力
- 支持
.docx、.doc、.wps、.txt、.md。
- 支持单文件、多文件、重复
-i、位置参数输入,以及一个或多个目录;目录输入默认递归扫描,输出目录保留原结构。
- 自动识别题目、副标题、四级标题、二级标题段内正文、图/表标题、附件标识。
- 可选表格内容自动调整、数字和字母单独字体、符号标准化。
- TXT/MD 支持三种空行模式:不改动任何空行;删除单个空行,多个空行保留至 1 个空行;保留单个空行,多个空行保留至 1 个空行。
- TXT/MD 中手写数字编号(如
1.、1.2.3)按源文档保留,不自动递增重排。
- 支持自动读取当前目录
wfp_config.json、指定 JSON 配置文件、内联 JSON、--set key=value 和便利开关覆盖配置。
使用前检查
- 确认脚本路径:脚本位于本 Skill 目录下的
scripts/wfp_cli.py。如果当前工作目录不是 Skill 目录,使用 SKILL.md 所在目录推导脚本绝对路径,或先 cd 到 Skill 目录。
- 检查输入:如果用户没有给出文件或目录,请先要求提供输入路径;告知支持
.docx/.doc/.wps/.txt/.md,目录默认递归处理。
- 检查配置:CLI 会自动读取当前工作目录的
wfp_config.json。如果用户指定 --config 或明确给出配置文件,使用用户指定配置;否则说明将使用当前目录配置或内置默认配置。
- 检查转换条件:Windows 处理
.doc/.wps 时优先使用 WPS/Word 和 pywin32;macOS/Kylin/Linux 或 COM 不可用时,CLI 会尝试调用 LibreOffice soffice 转为 .docx。如果未安装 LibreOffice,旧格式文件会记录为跳过,继续处理 .docx/.txt/.md;如用户必须处理旧格式,再提示安装 LibreOffice、用 --soffice 指定路径,或先另存为 .docx。
常用命令
python scripts/wfp_cli.py format -i report.docx
python scripts/wfp_cli.py format -i report.docx -o report_final.docx
python scripts/wfp_cli.py format -i ./documents -o ./documents_formatted
python scripts/wfp_cli.py format -i a.docx -i b.txt c.md -o ./formatted_output
python scripts/wfp_cli.py format -i ./documents -o ./documents_formatted --no-recursive
python scripts/wfp_cli.py format -i input.docx --config ./wfp_config.json
python scripts/wfp_cli.py format -i old.doc --soffice /Applications/LibreOffice.app/Contents/MacOS/soffice
python scripts/wfp_cli.py format -i input.docx --set body_size=12 --enable-table-formatting
python scripts/wfp_cli.py format -i input.docx --config-json "{\"force_a4\": true, \"line_spacing\": 30}"
python scripts/wfp_cli.py format -i draft.md
python scripts/wfp_cli.py show-config
python scripts/wfp_cli.py save-config
python scripts/wfp_cli.py install-help
python scripts/wfp_cli.py test
配置处理流程
当用户要求调整字体、字号、边距、行距、表格、符号等配置时:
- 运行
show-config 了解当前配置来源和值。
- 将用户自然语言需求映射到配置字段。
- 用
save-config --set ... 或便利开关保存到当前目录 wfp_config.json,或保存到用户指定路径。
- 再运行
format 处理文档。
用户只要求一次性临时调整时,可用 --config-json 或 --set 直接运行 format。
输出行为
- 成功生成的
.docx 绝对路径写入 stdout。
- 详细日志仅在使用
-v/--verbose 时写入 stderr。
- 退出码
0 表示没有失败;macOS/Kylin/Linux 未安装 LibreOffice 导致的 .doc/.wps 跳过会写入 stderr,但不会阻止其他文件处理。非 0 表示没有找到可处理文件或至少一个文件失败。
- 目录处理中单个文件失败不会阻止后续文件继续处理。
- 处理失败时,最终回复应说明失败文件和错误原因。
完成后必读
每次完成格式化后,都要提醒用户打开输出文件抽查题目、副标题、标题层级、附件、图/表标题、页码和表格。
如果处理过 .doc/.wps 或 Word/WPS 类文档,尤其要检查自动编号。自动编号未能确认转换成功时,编号文本、段落缩进、字体字号可能没有正常格式化;如果编号无法单独选中,说明可能仍是 Word/WPS 自动编号,必要时请将其转为手写文本编号后重新运行工具。
表格内容自动调整、符号标准化属于更容易影响版面的增强项,重要文件建议在副本上检查效果。
Reference Files
- 需要完整命令格式、参数说明、更多命令示例时,读取
references/cli-reference.md。
- 需要把用户配置需求映射到字段、查看字号对照时,读取
references/config-reference.md。
- 需要说明默认排版规则、标题识别、页面段落、TXT/MD、表格和附件规则时,读取
references/formatting-rules.md。
Agent 使用准则
- 没有输入时不要直接运行
format。
- 用户询问配置时运行
show-config,不要凭记忆列配置。
- 用户提出配置修改时,优先保存配置,再用该配置处理文档。
- 用户只要求一次性临时调整时,可用
--config-json 或 --set 直接运行 format。
- 目录输入默认递归;只有用户明确要求“只处理当前目录”时才加
--no-recursive。
- macOS/Kylin/Linux 或 COM 不可用环境下,可以处理
.doc/.wps 的前提是 LibreOffice soffice 可用;LibreOffice 不可用时旧格式会跳过,不要承诺可转换自动编号。
- 处理结束后必须提示用户检查自动编号所在标题和段落的转换效果,并提醒用户如启用了表格内容自动调整、数字和字母单独字体、符号标准化,应重点抽查版面。