Ejecuta cualquier Skill en Manus
con un clic

Ejecuta cualquier Skill en Manus con un clic

pdf

当用户希望对 PDF 文件进行任何操作时，请使用此技能。这包括读取或从 PDF 中提取文本/表格、将多个 PDF 合并为一个、拆分 PDF、旋转页面、添加水印、创建新 PDF、填写 PDF 表单、加密/解密 PDF、提取图像以及对扫描的 PDF 进行 OCR 以使其可搜索。如果用户提到 .pdf 文件或要求生成一个，请使用此技能。

Ejecutar en Manus

Resumen

Comando de instalación

npx skills add https://github.com/Fantasia1999/skills-zh --skill pdf

Copia y pega este comando en Claude Code para instalar la habilidad

Fuente

Fantasia1999/skills-zh

Estrellas0

Forks0

Actualizado6 de marzo de 2026, 11:14

SKILL.md

readonly

Más de este repositorio

mismo repositorio

skills-zh-updater

Fantasia1999/skills-zh

同步并维护 anthropics/skills 仓库的中文翻译。用于：拉取上游更新、增量翻译/全量翻译 SKILL.md、生成中文索引 INDEX_ZH.md，并快速检查翻译完整性。

2026-03-060

algorithmic-art

Fantasia1999/skills-zh

使用 p5.js 创作带有种子随机性和交互式参数探索的算法艺术。当用户请求使用代码创作艺术、生成艺术、算法艺术、流场或粒子系统时使用此技能。创作原创算法艺术，而非复制现有艺术家的作品，以避免侵犯版权。

2026-03-060

canvas-design

Fantasia1999/skills-zh

使用设计哲学在 .png 和 .pdf 文档中创作精美的视觉艺术。当用户要求创作海报、艺术品、设计或其他静态作品时，应使用此技能。创作原创视觉设计，绝不抄袭现有艺术家的作品，以避免侵犯版权。

2026-03-060

doc-coauthoring

Fantasia1999/skills-zh

引导用户完成结构化的文档协同创作工作流。当用户想要撰写文档、提案、技术规格、决策文档或类似的结构化内容时使用。此工作流帮助用户高效地传递上下文，通过迭代优化内容，并验证文档对读者是否有效。当用户提及撰写文档、创建提案、起草规格或类似的文档任务时触发。

2026-03-060

docx

Fantasia1999/skills-zh

当用户想要创建、读取、编辑或操作 Word 文档（.docx 文件）时，使用此技能。触发条件包括：任何提及“Word 文档”、“word document”、“.docx”的情况，或要求生成包含目录、标题、页码或信头等格式的专业文档。当从 .docx 文件中提取或重组内容、在文档中插入或替换图片、在 Word 文件中执行查找和替换、处理修订或批注，或将内容转换为精美的 Word 文档时，也应使用此技能。如果用户要求将“报告”、“备忘录”、“信函”、“模板”或类似的交付成果作为 Word 或 .docx 文件，请使用此技能。请勿用于 PDF、电子表格、Google Docs 或与文档生成无关的常规编码任务。

2026-03-060

frontend-design

Fantasia1999/skills-zh

创建具有高设计品质、独特的生产级前端界面。当用户要求构建 Web 组件、页面、作品、海报或应用程序时（例如网站、落地页、仪表盘、React 组件、HTML/CSS 布局，或对任何 Web UI 进行样式美化），使用此技能。生成富有创意、精美的代码和 UI 设计，避免千篇一律的 AI 审美。

2026-03-060

Fuente

Fantasia1999

Fantasia1999/skills-zh

Abrir repositorio de GitHub Ver repositorios del creador

Comando de instalación

Descarga

Ejecutar en Manus

Útil paraSOC

Desarrolladores de softwareOcupaciones informáticas y matemáticas15-1252L4

name	pdf
description	当用户希望对 PDF 文件进行任何操作时，请使用此技能。这包括读取或从 PDF 中提取文本/表格、将多个 PDF 合并为一个、拆分 PDF、旋转页面、添加水印、创建新 PDF、填写 PDF 表单、加密/解密 PDF、提取图像以及对扫描的 PDF 进行 OCR 以使其可搜索。如果用户提到 .pdf 文件或要求生成一个，请使用此技能。
license	Proprietary. LICENSE.txt 含有完整条款

PDF 处理指南

概述

本指南涵盖了使用 Python 库和命令行工具进行核心 PDF 处理操作。有关高级功能、JavaScript 库和详细示例，请参阅 REFERENCE.md。如果您需要填写 PDF 表单，请阅读 FORMS.md 并遵循其说明。

快速入门

from pypdf import PdfReader, PdfWriter

# 读取一个 PDF
reader = PdfReader("document.pdf")
print(f"Pages: {len(reader.pages)}")

# 提取文本
text = ""
for page in reader.pages:
    text += page.extract_text()

Python 库

pypdf - 基本操作

合并 PDF

from pypdf import PdfWriter, PdfReader

writer = PdfWriter()
for pdf_file in ["doc1.pdf", "doc2.pdf", "doc3.pdf"]:
    reader = PdfReader(pdf_file)
    for page in reader.pages:
        writer.add_page(page)

with open("merged.pdf", "wb") as output:
    writer.write(output)

拆分 PDF

reader = PdfReader("input.pdf")
for i, page in enumerate(reader.pages):
    writer = PdfWriter()
    writer.add_page(page)
    with open(f"page_{i+1}.pdf", "wb") as output:
        writer.write(output)

提取元数据

reader = PdfReader("document.pdf")
meta = reader.metadata
print(f"Title: {meta.title}")
print(f"Author: {meta.author}")
print(f"Subject: {meta.subject}")
print(f"Creator: {meta.creator}")

旋转页面

reader = PdfReader("input.pdf")
writer = PdfWriter()

page = reader.pages[0]
page.rotate(90)  # 顺时针旋转 90 度
writer.add_page(page)

with open("rotated.pdf", "wb") as output:
    writer.write(output)

pdfplumber - 文本和表格提取

提取带布局的文本

import pdfplumber

with pdfplumber.open("document.pdf") as pdf:
    for page in pdf.pages:
        text = page.extract_text()
        print(text)

提取表格

with pdfplumber.open("document.pdf") as pdf:
    for i, page in enumerate(pdf.pages):
        tables = page.extract_tables()
        for j, table in enumerate(tables):
            print(f"第 {i+1} 页的表格 {j+1}:")
            for row in table:
                print(row)

高级表格提取

import pandas as pd

with pdfplumber.open("document.pdf") as pdf:
    all_tables = []
    for page in pdf.pages:
        tables = page.extract_tables()
        for table in tables:
            if table:  # 检查表格是否非空
                df = pd.DataFrame(table[1:], columns=table[0])
                all_tables.append(df)

# 合并所有表格
if all_tables:
    combined_df = pd.concat(all_tables, ignore_index=True)
    combined_df.to_excel("extracted_tables.xlsx", index=False)

reportlab - 创建 PDF

创建基本 PDF

from reportlab.lib.pagesizes import letter
from reportlab.pdfgen import canvas

c = canvas.Canvas("hello.pdf", pagesize=letter)
width, height = letter

# 添加文本
c.drawString(100, height - 100, "Hello World!")
c.drawString(100, height - 120, "This is a PDF created with reportlab")

# 添加一条线
c.line(100, height - 140, 400, height - 140)

# 保存
c.save()

创建多页 PDF

from reportlab.lib.pagesizes import letter
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak
from reportlab.lib.styles import getSampleStyleSheet

doc = SimpleDocTemplate("report.pdf", pagesize=letter)
styles = getSampleStyleSheet()
story = []

# 添加内容
title = Paragraph("Report Title", styles['Title'])
story.append(title)
story.append(Spacer(1, 12))

body = Paragraph("This is the body of the report. " * 20, styles['Normal'])
story.append(body)
story.append(PageBreak())

# 第 2 页
story.append(Paragraph("Page 2", styles['Heading1']))
story.append(Paragraph("Content for page 2", styles['Normal']))

# 构建 PDF
doc.build(story)

上标和下标

重要提示：切勿在 ReportLab PDF 中使用 Unicode 上标/下标字符 (₀₁₂₃₄₅₆₇₈₉, ⁰¹²³⁴⁵⁶⁷⁸⁹)。内置字体不包含这些字形，会导致它们渲染为实心黑框。

作为替代，应在 Paragraph 对象中使用 ReportLab 的 XML 标记标签：

from reportlab.platypus import Paragraph
from reportlab.lib.styles import getSampleStyleSheet

styles = getSampleStyleSheet()

# 下标：使用 <sub> 标签
chemical = Paragraph("H<sub>2</sub>O", styles['Normal'])

# 上标：使用 <super> 标签
squared = Paragraph("x<super>2</super> + y<super>2</super>", styles['Normal'])

对于画布绘制的文本（非 Paragraph 对象），应手动调整字体大小和位置，而不是使用 Unicode 上标/下标。

命令行工具

pdftotext (poppler-utils)

# 提取文本
pdftotext input.pdf output.txt

# 提取文本并保留布局
pdftotext -layout input.pdf output.txt

# 提取特定页面
pdftotext -f 1 -l 5 input.pdf output.txt  # 第 1-5 页

qpdf

# 合并 PDF
qpdf --empty --pages file1.pdf file2.pdf -- merged.pdf

# 拆分页面
qpdf input.pdf --pages . 1-5 -- pages1-5.pdf
qpdf input.pdf --pages . 6-10 -- pages6-10.pdf

# 旋转页面
qpdf input.pdf output.pdf --rotate=+90:1  # 将第 1 页旋转 90 度

# 移除密码
qpdf --password=mypassword --decrypt encrypted.pdf decrypted.pdf

pdftk (如果可用)

# 合并
pdftk file1.pdf file2.pdf cat output merged.pdf

# 拆分
pdftk input.pdf burst

# 旋转
pdftk input.pdf rotate 1east output rotated.pdf

常见任务

从扫描的 PDF 中提取文本

# 需要: pip install pytesseract pdf2image
import pytesseract
from pdf2image import convert_from_path

# 将 PDF 转换为图像
images = convert_from_path('scanned.pdf')

# 对每一页进行 OCR
text = ""
for i, image in enumerate(images):
    text += f"Page {i+1}:\n"
    text += pytesseract.image_to_string(image)
    text += "\n\n"

print(text)

添加水印

from pypdf import PdfReader, PdfWriter

# 创建水印（或加载现有水印）
watermark = PdfReader("watermark.pdf").pages[0]

# 应用到所有页面
reader = PdfReader("document.pdf")
writer = PdfWriter()

for page in reader.pages:
    page.merge_page(watermark)
    writer.add_page(page)

with open("watermarked.pdf", "wb") as output:
    writer.write(output)

提取图像

# 使用 pdfimages (poppler-utils)
pdfimages -j input.pdf output_prefix

# 这会将所有图像提取为 output_prefix-000.jpg, output_prefix-001.jpg 等文件。

密码保护

from pypdf import PdfReader, PdfWriter

reader = PdfReader("input.pdf")
writer = PdfWriter()

for page in reader.pages:
    writer.add_page(page)

# 添加密码
writer.encrypt("userpassword", "ownerpassword")

with open("encrypted.pdf", "wb") as output:
    writer.write(output)

快速参考

任务	最佳工具	命令/代码
合并 PDF	pypdf	`writer.add_page(page)`
拆分 PDF	pypdf	每个文件一页
提取文本	pdfplumber	`page.extract_text()`
提取表格	pdfplumber	`page.extract_tables()`
创建 PDF	reportlab	Canvas 或 Platypus
命令行合并	qpdf	`qpdf --empty --pages ...`
OCR 扫描的 PDF	pytesseract	先转换为图像
填写 PDF 表单	pdf-lib 或 pypdf (见 FORMS.md)	见 FORMS.md

后续步骤

关于 pypdfium2 的高级用法，请参阅 REFERENCE.md
关于 JavaScript 库 (pdf-lib)，请参阅 REFERENCE.md
如果您需要填写 PDF 表单，请遵循 FORMS.md 中的说明
关于故障排除指南，请参阅 REFERENCE.md