with one click
paper-comic
// 论文方法图解——用视觉图解彻底讲清楚一篇论文到底做了什么、怎么做的。 自动分析论文核心方法,先推荐封面/概述图/机制细节图的生成方案,必须由用户确认范围、张数、语言、风格后再生成。 支持温暖笔记风和论文框架图风。
// 论文方法图解——用视觉图解彻底讲清楚一篇论文到底做了什么、怎么做的。 自动分析论文核心方法,先推荐封面/概述图/机制细节图的生成方案,必须由用户确认范围、张数、语言、风格后再生成。 支持温暖笔记风和论文框架图风。
将论文、技术文章或知识内容制作成高真实感的 AIGC 幻灯片。先做叙事结构和逐页视觉导演,再调用生图模型生成每一页 16:9 slide image,最后合成为 PPTX/PDF。适合论文汇报、组会、公开课、技术分享、商业化研究展示;当用户提到“论文PPT”“AI生成PPT”“不像AI的PPT”“高质感幻灯片”“逐页生图PPT”时使用。
将学术论文转化为深度HTML长文。6轮强制工作流、代码仓库搜索、公式渲染、Mermaid图表。 3种写作风格,输出可直接分享的精美HTML页面。
| name | paper-comic |
| description | 论文方法图解——用视觉图解彻底讲清楚一篇论文到底做了什么、怎么做的。 自动分析论文核心方法,先推荐封面/概述图/机制细节图的生成方案,必须由用户确认范围、张数、语言、风格后再生成。 支持温暖笔记风和论文框架图风。 |
把论文的核心方法用视觉图解彻底讲清楚。
| 传统paper-comic | baoyu-article-illustrator | 我们:方法图解 | |
|---|---|---|---|
| 聊什么 | 什么都聊一点 | 为文章配装饰图 | 只聊方法细节 |
| 深度 | 一页讲很多→浅 | 一张图一段话→中 | 一张图讲透一个机制→深 |
| 页数 | 固定10页 | 按密度5-20张 | 先推荐封面/概述/细节图组合,用户确认后生成1-10张 |
| 重点 | 讲背景+故事 | 美化文章排版 | 可视化"怎么做" |
/paper-comic /path/to/paper.pdf
/paper-comic https://arxiv.org/abs/2512.xxxxx
/paper-comic /path/to/paper.pdf --style sketchnote
/paper-comic /path/to/paper.pdf --style paper-figure --language English --pages 1
和paper-analyzer一样,不硬编码任何API。运行时自动检测:
| 环境 | 自动使用 |
|---|---|
| Codex | 内置 imagegen skill |
| Claude Code | 已安装的生图skill(如baoyu-image-gen) |
| Cursor/其他 | 自动检测 → 没有则提示安装 |
不写死任何API key、token或endpoint在SKILL.md里。
一个完全没读过论文的人,只看这张图+图上的标注文字,能不能理解这个机制?
能 → 通过。不能 → 拆成两张,或者加更多标注。
默认不要直接生成图片。先读论文、给出推荐方案,再向用户确认。
只有当用户已经明确给出足够完整的生成意图时,才可以跳过确认,例如:
如果用户只给了论文链接、只说了风格(如“sketchnote”)、或只说“生成图解”,仍然必须确认,因为风格不等于范围/张数授权。
确认时必须覆盖:
sketchnote 或 paper-figure确认话术示例:
我读完后建议生成6张:1张封面、1张方法总览、3张机制细节、1张关键结果。也可以只生成1张总览图,或者扩展到8张把每个机制讲更细。你想生成哪种范围?语言用中文/英文/双语?风格用 sketchnote 还是 paper-figure?
如果用户没有回答,不要继续生成。
| 画风 | 视觉效果 | 适合场景 | 特点 |
|---|---|---|---|
| sketchnote(默认) | 温暖科研笔记风 | 讲清楚论文在做什么、视频宣传、知识分享 | 工整但有人味,允许小符号、小比喻、小视觉锚点,让人一眼理解 |
| paper-figure | 论文框架图风 | README首屏、论文解读文章、方法总览、技术展示 | 像顶会论文里的总览框架图,但更完整、更漂亮、更适合传播 |
默认推荐 sketchnote。当用户想要“像论文 Figure 一样专业”“方法框架图”“技术架构图”“放 README 第一屏很震撼”时,推荐 paper-figure。
读完论文后,列出论文的所有内容点,然后只保留需要图解的部分:
必须图解(每个1-2页):
可选图解(如果方法复杂才加):
不图解:
先输出一个简短推荐,不要立刻生成:
我建议生成 6 张:
1. 封面图:论文一句话贡献 + 视觉锚点
2. 方法总览图:解释整体输入、核心模块、输出
3. 核心机制A:拆开最重要的创新点
4. 核心机制B:解释训练/推理/数据流中的关键环节
5. 核心机制C:补足容易误解的内部细节
6. 关键结果图:用一张图说明为什么有效
也可以:
- 只生成 1 张总览图
- 生成 3 张:总览 + 2 张核心机制
- 扩展到 8-10 张,把每个机制讲得更细
请确认:
- 语言:中文 / English / 双语
- 风格:sketchnote / paper-figure
- 范围:只要封面/总览,还是生成全部推荐图?
如果用户没有回答,不要继续生成。
根据论文复杂度,AI只做推荐,最终由用户确认:
| 论文复杂度 | 推荐页数 | 内容分配 |
|---|---|---|
| 封面/传播图 | 1页 | 一张封面或高层总览,讲清楚论文做了什么 |
| 快速理解 | 2-3页 | 总览+核心机制+结果 |
| 中等(2个核心方法) | 4-6页 | 封面/总览+2-3个机制+关键结果 |
| 复杂(3+个核心方法) | 6-10页 | 封面/总览+每个机制1页+对比/结果 |
规则:最少1页,最多10页。宁少勿多——1张总览图讲清楚,比10张讲糊涂好。
不是"生成prompt",而是先用自然语言描述清楚这一页到底要表达什么:
第3页:多头注意力机制的内部构造
这一页要讲清楚:Q、K、V是怎么算出来的,它们之间怎么交互。
画面布局(从左到右):
- 左侧:输入x,一个向量表示
- 中间上方:三条线分别到三个方框(Linear_Q, Linear_K, Linear_V)
- 三个方框各产出Q、K、V三个矩阵
- 中间核心区域:Q和K做点积→除以√dk→softmax→得到注意力权重
- 权重和V相乘→输出
- 右侧:多个这样的"头"并行排列,最后拼接
关键标注:
- 每个方框旁标运算和维度(如"Linear_Q: x→Q(d×dk)")
- Q×K^T的计算用可视化的矩阵乘法图(小格图)
- softmax后的权重用颜色深浅表示(越深=越关注)
要求:描述要具体到"这个箭头从哪到哪,这个方框里写什么字"。
同时检查每页的信息密度:
根据当前运行环境自动选择生图后端。为每一页创建prompt文件 → 用结构化prompt生成。
结构化prompt格式(参考但不照抄baoyu):
【类型】流程分解图
【风格】sketchnote
【语言】中文
【主题】多头注意力机制内部构造
【视觉结构】
- 水平布局,从左到右5个区域
- 每个区域用虚线框隔开
- 关键路径用粗箭头连接
【要标注的文字】
1. Input: x ∈ R^(n×d)
2. Q = xW_Q ... (完整标注)
...
【颜色限制】
- 背景:明亮浅米白,不要泛黄旧纸
- 主色:黑色手绘线条
- 强调色:深蓝/珊瑚红/橄榄绿/柔和黄色,少量使用
- 其他:保持清爽手抄报感,避免复古暗色
【禁止】
- 不要代码块
- 不要照片写实
- 不要3D渲染
- 不要生成用户没有确认的额外页面
- 不要旧羊皮纸、暗角、污渍、重纸纹、黄褐色复古调
- 不要大面积空白;主体图解占画面75%-85%
生成 [topic]-illustrated.md:
# [论文标题] — 图解
## 论文信息
- 论文:[链接]
- 风格:sketchnote
- 页数:6
## 封面

**一句话**:[论文做了什么,为什么重要]
## 第1页:方法总览

**讲解**:整个方法从输入到输出的完整流程。关键看第X步,这是本文的创新。
## 第2页:核心机制A — [名称]

**讲解**:这个机制解决了XX问题。具体做法是...关键设计在于...
[重复...]
## 总结:3个核心要点
1. [要点1]
2. [要点2]
3. [要点3]
references/base-prompt.md — 图解生成基础规范(结构、文字、色彩要求)references/styles/sketchnote.md — 温暖科研笔记风references/styles/paper-figure.md — 论文框架图风