with one click
paper-deck
// 将论文、技术文章或知识内容制作成高真实感的 AIGC 幻灯片。先做叙事结构和逐页视觉导演,再调用生图模型生成每一页 16:9 slide image,最后合成为 PPTX/PDF。适合论文汇报、组会、公开课、技术分享、商业化研究展示;当用户提到“论文PPT”“AI生成PPT”“不像AI的PPT”“高质感幻灯片”“逐页生图PPT”时使用。
// 将论文、技术文章或知识内容制作成高真实感的 AIGC 幻灯片。先做叙事结构和逐页视觉导演,再调用生图模型生成每一页 16:9 slide image,最后合成为 PPTX/PDF。适合论文汇报、组会、公开课、技术分享、商业化研究展示;当用户提到“论文PPT”“AI生成PPT”“不像AI的PPT”“高质感幻灯片”“逐页生图PPT”时使用。
| name | paper-deck |
| description | 将论文、技术文章或知识内容制作成高真实感的 AIGC 幻灯片。先做叙事结构和逐页视觉导演,再调用生图模型生成每一页 16:9 slide image,最后合成为 PPTX/PDF。适合论文汇报、组会、公开课、技术分享、商业化研究展示;当用户提到“论文PPT”“AI生成PPT”“不像AI的PPT”“高质感幻灯片”“逐页生图PPT”时使用。 |
把论文/知识内容做成看起来真的被设计过的幻灯片。
核心路线不是用 PPT 对象硬摆版式,而是:
Paper Deck 的 V1 是 raster-first AIGC slide image 工作流。除非用户明确要求“不要生图”“用代码画图”“只要可编辑 PPT”或“使用 HTML/SVG/Canvas 生成”,否则必须调用真实的 raster image generation backend 为每一页生成图片。
严格禁止把以下产物冒充为本 skill 的“生图页”:
允许的本地处理仅限:
deck-brief.md 和交付说明中明确记录“混合文字层”,不能声称整页文字都由生图模型完成如果当前环境没有可用的 raster image generation backend,必须停止并说明缺少生图后端;不要退化成本地绘图替代方案。
适合:
不适合:
如果用户需要完全可编辑的 PPT,说明本 skill 的 V1 是 raster-first;可改用常规 PPTX 工具,或生成“图片背景 + 可编辑文字层”的混合方案。
接受:
如果是论文,优先复用 paper-analyzer 的阅读方式:读摘要、方法、实验、图表、结论;必要时搜索代码仓库。目标不是写长文,而是提取适合做 slide 的核心叙事。
输出并保存 analysis.md:
默认必须确认,不要直接生成图片。除非用户明确说“直接生成/不用确认/按默认来”。
询问时控制在 3 个问题以内:
references/style-system.md。推荐话术:
我建议做 12 页,风格用 journal-minimal:像 Nature/IEEE 论文图 + 正式学术汇报,清晰、克制、不花哨。
也可以换成 business-research 做商业研究分享,warm-notes 做手记风,或 liquid-glass 做 Apple 式玻璃质感。
这篇论文我建议在第 4 页插入原论文方法图局部截图,第 8 页插入实验曲线/表格截图,再基于这些真实素材做设计化排版。
确认后我会先生成 outline.md 和每页 prompt,再逐页出图并合成 PPTX/PDF。
保存 deck-brief.md。必须包含:
style_presetaudienceslide_countlanguagevisual_rulesdo_not_usereference_images(如有)source_visual_plan:哪些页使用真实图表/截图,来源和处理方式风格细节按需读取 references/style-system.md。
真实素材策略按需读取 references/source-visuals.md。
保存 outline.md。每页用固定结构:
## 01. Slide Title
- Role: cover / context / method / mechanism / evidence / result / takeaway
- Message: 这一页唯一要讲清楚的观点
- Visual: 画面主视觉和构图
- Text: 页面上允许出现的短文字
- Evidence: 引用的论文图表/公式/实验数据/代码位置
- Source visual: 是否使用真实截图/论文图表;来源、裁剪范围和落位
- Repair handle: 后续返修时可引用的定位描述
规则:
每页必须先写 prompt 文件,再调用任何生图工具。
路径:
paper-deck/{topic-slug}/
├── analysis.md
├── deck-brief.md
├── outline.md
├── prompts/
│ ├── 01-slide-cover.md
│ ├── 02-slide-context.md
│ └── ...
├── images/
│ ├── 01-slide-cover.png
│ ├── 02-slide-context.png
│ └── ...
├── {topic-slug}.pptx
└── {topic-slug}.pdf
Prompt 写法读取 references/prompt-template.md。
硬规则:
图片后端选择:
imagegen。baoyu-imagine、Gemini、OpenAI、Seedream 等后端,按用户指定。生图门禁:
prompts/NN-*.md。images/ 的主图必须来自真实 raster image generation backend。images/ 中仍必须保留每页的生图背景或生图整页来源,并在 deck-brief.md 记录哪些文字是后叠加的。generation-log.md 记录每页使用的后端、prompt 文件、输出文件、生成时间;没有生成记录的图片不能作为最终交付页。生成策略:
生成完图片后运行:
python3 <SKILL_ROOT>/scripts/merge_deck.py paper-deck/{topic-slug}
脚本会读取 images/NN-*.png|jpg|webp,输出同名 .pptx 和 .pdf。每张图片铺满一页 16:9。
交付前按 references/quality-gate.md 检查:
generation-log.md 是否存在,且每一页都记录了真实 raster image generation backend、prompt 文件和输出文件返修时永远先改源文件:
| 用户说 | 操作 |
|---|---|
| “第 5 页更学术一点” | 改 prompts/05-*.md,保留旧图,生成新图 |
| “统一成第 1 页的质感” | 把第 1 页风格锚点追加到相关 prompts |
| “第 7 页文字太多” | 修改 outline 的 Text,再改 prompt |
| “只重做背景,不动内容” | 在 prompt 中保留 Message/Text,重写 Visual |
| “新增一页机制细节” | 更新 outline,新增 prompt,生成图片,重跑合成脚本 |
不要用程序在生成图上涂改文字。文字错了就改 prompt 重生成,或切换到混合文字层方案。
references/style-system.md:风格预设和选择规则references/layouts.md:常用页面角色与构图references/source-visuals.md:PDF 截图、论文图表、用户图片的使用策略references/prompt-template.md:逐页生图 prompt 模板references/quality-gate.md:交付前检查和返修标准