| name | gpt-image-2-paper-ppt-images |
| description | Use when generating PPT-style image slides, poetic presentation covers, quiet paper-texture visual pages, report pages, invitations, social cards, or slide-image sets with GPT-Image-2 via image_generate. |
| version | 1.0.0 |
| author | Hermes Agent |
| license | MIT |
| platforms | ["linux"] |
| metadata | {"hermes":{"tags":["gpt-image-2","image-generation","ppt","slides","paper-texture","visual-design","presentation"],"related_skills":["gpt-image-2-handdrawn-diagram","baoyu-infographic","ppt-keynote"],"source_author":"小小东","source_homepage":"https://x.com/xiaoxiaodong01","source_post":"https://x.com/xiaoxiaodong01/status/2056615926724976911","source_posts":["https://x.com/xiaoxiaodong01/status/2056615926724976911","https://x.com/xiaoxiaodong01/status/2056412276593410537","https://x.com/xiaoxiaodong01/status/2057338307051508107"]}} |
GPT-Image-2 Paper PPT Images
Overview
This skill generates PPT-style image pages with a light, quiet, paper-breathing visual language.
Use Hermes image_generate for rendering. In this environment, image_generate is backed by GPT-Image-2, so call it directly unless the user explicitly asks for another image backend.
Source credit: 小小东 — https://x.com/xiaoxiaodong01
Source posts:
The style is useful for:
- PPT covers and section dividers
- lecture / course pages
- report pages
- poetic information graphics
- invitations
- social cards
- product / person / menu / exhibition guide pages
The goal is not a normal slide template. The goal is quiet paper texture + soft floating visual nodes + restrained typography + strong whitespace control.
When to Use
Use this skill when the user asks for:
- PPT 式图片
- 一套 PPT 图片 / 课件图 / 报告页
- 轻盈安静的海报 / 封面 / 邀请函
- 带纸张呼吸感的视觉页
- GPT-Image-2 PPT prompt
- 把一个主题做成多张可直接放进 PPT 的图片
Do not use for editable .pptx production. If the user needs an editable PowerPoint file, use the PowerPoint / slide-generation skills instead.
Template Selection
This skill contains multiple GPT-Image-2 prompt templates under one shared PPT-image workflow. Pick by intent:
- Template A — Paper Breath / Soft Nodes: default for poetic PPT covers, quiet report pages, course pages, invitations, and social cards with floating visual nodes.
- Template B — Eastern Editorial / Booklet Page: use when the user wants 东方编辑感, 米纸/淡墨/陈木, Chinese editorial layout, restrained booklet-page PPT, tea/craft/culture/architecture/product/report visuals, or a calmer premium deck.
- Template C — Cropped Glyph / Oriental Grid: use for 3:4 小红书卡片、文化海报、信息图、排行榜、产品卡、人物专题、报告首页;核心是“巨大裁切汉字/数字/符号 + 极小注释 + 东方网格 + 朱印式强调色”。
- Template D — Dark Cropped Glyph / Serious Theme: use when Template C needs dark background, heavier historical / political / revolutionary / serious-report mood, or the user explicitly asks for 暗色版本.
If the user only says “PPT 风格图片” and gives no style, use Template A. If the topic has cultural, craft, tea, humanities, architecture, heritage, or editorial-publication flavor, prefer Template B. If the user asks for 小红书卡片、3:4、书卷气、强文字骨架、巨大汉字裁切, prefer Template C; add Template D when the brief says 暗色背景 or serious/revolutionary palette.
Core Visual Grammar
Lock these shared properties:
- Paper atmosphere: warm white or pale gray-white background, subtle grain, fiber, old-film softness.
- Soft visual nodes: objects, people fragments, data points, symbols, or abstract shapes float like misted color masses.
- Single-family color: one main color system; accent color only in tiny details, labels, numbers, or texture anchors.
- Sparse rhythm: objects scattered but intentional, following a diagonal, arc, breathing path, or asymmetrical balance.
- Typographic restraint: small corner metadata, page number, date, vertical Chinese / Japanese / numbers / chapter words; title does not need to be huge.
- Quiet intelligence: low voice, slightly strange, soft and sharp at once; whitespace matters more than decoration.
Template A — Paper Breath / Soft Nodes
Use this as the default base template. Replace the final topic and usage fields with the user's actual content.
请把画面处理成一种轻盈、安静、带纸面呼吸感的视觉作品:大面积温白或浅灰白背景像细颗粒印刷纸,略有噪点、纤维和柔和的旧胶片质感,不要做成干净塑料感或高饱和商业海报。主体不必照搬蓝莓,可以是任何与当前内容相关的物件、信息节点、人物局部、产品、数据点、概念符号或抽象形状,但它们应像柔软的色团一样悬浮在画面里,边缘被轻微雾化,中心有更深的色值,外圈向背景自然扩散,形成“靠近才发现层次”的细腻渐变。每个主体最好带一个小而清晰的暗部细节、切口、星形、标签、符号、编号或纹理锚点,让模糊的色团有记忆点,也让视线能从一个点跳到另一个点。
色彩遵循参考图的角色关系,而不是固定复制紫色。背景承担空气和留白,保持低饱和、偏温、轻颗粒;主体色根据内容气质改变,可以变得更学术、更清洁、更甜润、更锋利、更复古或更技术,但仍保持单一主色系的柔雾渐层,不要彩虹化。强调色只占很小面积,用在主体的中心、边缘细节、关键数字或微小标注上,负责情绪转折和阅读停顿。文字色使用低饱和的橄榄灰、旧金、烟褐、墨灰或与主题相称的沉静深色,像印在纸上的细线,而不是抢眼标题。阴影和深度也从主色内部生成,靠透明度、颗粒、模糊半径和轻微叠色形成层次。
版式要有明确的空白控制:主体散落但不是随机,整体沿一条隐约的斜向、弧线或呼吸式阅读路径移动,形成上轻下稳、左松右紧或中部漂浮的节奏。对象之间保持距离,让每个色团周围有安静的空气;可以有局部靠近、错位或轻微重叠,但不要排成机械网格。文字是画面结构的一部分:角落放置很小的英文、日期、页码、署名或元信息;一侧可以使用竖排中文、日文、数字、章节名或关键词,笔画细、间距松、像边界线一样拉住画面。标题不需要巨大,必要时让短句、竖排字、数字和注释成为构图重心的反向平衡。所有文字都要克制、清晰、留有边距,像设计学院作业、独立出版物、视觉实验海报或诗性信息图,而不是模板封面。
整体气质应是低声的、聪明的、有一点奇异感:少量颜色在白纸上发光,柔软和尖锐并存,空白比装饰更重要。适用于海报、PPT封面、报告页、信息图、排行榜、数据可视化、产品页、人物介绍、菜单、展览导视或社交卡片时,都把内容转化为若干有呼吸的视觉节点,用轻颗粒、雾化色彩、边缘文字和稀疏节奏组织阅读。现在把这种美学用于我的实际内容,让画面自然长成它需要的形式。
本次主题:
{主题}
每页的信息你自己规划
——————
用途:ppt、课件,最少10张ppt
Template B — Eastern Editorial / Booklet Page
Use this template when the deck should feel like a refined Chinese editorial booklet: quiet, restrained, publication-grade, with rice paper, pale ink, warm wood, moon-gate / arch / folding-fan / lifted-page windows, sparse line drawings, and modern information hierarchy.
Source: 小小东 — https://x.com/xiaoxiaodong01/status/2056412276593410537
请把画面处理成一种安静、克制、带有东方编辑感的高级视觉:它像一页被精心排过的纸本册页,又能自然适应现代信息设计。整体不要追求炫技和饱满,而要让留白成为主要结构,让内容在米纸、浅灰、淡墨、温润木色之间缓慢显形。画面可以有一两个柔和的图像窗口,像拱门、月洞、折扇或被风掀开的纸页,以大曲线切开空间,让照片、插图、数据或文字像被安放在旧院落的一角;这些窗口不必对称,边缘要干净,比例要有呼吸感,避免硬盒子、廉价圆角卡片和过度装饰。
如果出现影像,尽量让它带有低饱和、微雾、柔焦、侧光和时间感,像茶席、器物、手作、建筑、植物、文献或人物的一个片段,而不是完整说明一切。物体可以少,位置要准,宁可只露出半盏、一段桌面、一层纸纹、一束线描,也不要堆满素材。线描元素应像手边随笔留下的细线,轻、准、留有空隙,可用于手势、花枝、器物、路径、关系或隐喻,但不能变成花哨插画。色彩保持温和而有层次,主色接近宣纸和陈木,辅以墨灰、烟绿、茶褐、陶土、暗金或极淡的冷灰;任何醒目的颜色都应像印章或小标记,只承担必要的强调。
文字是画面气质的一部分,而不是贴上去的说明。中文可以有竖排、窄列、细长分行、古籍式停顿,也可以和现代无衬线数字、英文小字形成距离感;标题要像一块安静的重石,正文要像低声叙述,数字、日期、排名、图例、注释和索引要被整理成细线、短横、微小刻度或稀疏坐标。不要使用模板化的信息块,不要把所有内容平均分配到网格里,要让主次像书页气口一样自然形成:一处大留白,一处沉静主体,几组细小信息,少量线条把它们轻轻牵住。
当内容是PPT或报告,页面要像一组可翻阅的章节,每页只承担一个清晰判断,信息密度可以高,但必须有静气和秩序;当内容是信息图或数据可视化,图表应像墨线、案几、器物边缘或折页刻度那样被简化,重点数字要被安放而不是喊出;当内容是封面、海报、社媒卡片或排行榜,要让标题、图像和信息之间保持可被凝视的距离,既有东方审美的含蓄,也有现代编辑的准确。避免复古仿品感、茶文化套壳、空洞禅意、AI油亮质感、堆砌书法和廉价国风素材;它应该更像一种成熟的版面判断:淡、准、疏、稳,视觉很轻,但每个位置都有分量。
现在把这种美学用于我的实际内容:请根据我接下来提供的主题、文字、数据或用途,让画面自然长成它需要的形式,在静默留白中建立清晰的信息层级与可记住的视觉气质。
本次主题:
{主题}
用途:ppt、课件,不低于10张。每页信息和知识点由你规划,要求有趣、有料、生动。
Template B Adaptation Rules
- Use for topics with humanities, tea, craft, culture, architecture, place, people, brand story, report, exhibition, or editorial mood.
- Prefer rice-paper background, pale ink, warm wood, smoke green, tea brown, terracotta, dark gold, and very pale cool gray.
- Use one or two soft image windows, not many cards.
- For data pages, simplify charts into ink lines, fold marks, sparse coordinates, or object-edge metaphors.
- Avoid fake retro, empty Zen, shiny AI texture, piled calligraphy, cheap guofeng assets, and tea-culture cosplay.
Template C — Cropped Glyph / Oriental Grid
Use this template for a bookish, high-pressure Chinese editorial system: huge cropped characters / numbers / symbols act as the spatial skeleton, while tiny annotations create dense but breathable knowledge layers. It is especially good for 3:4 小红书卡片, PPT covers, report homepages, information graphics, rankings, product cards, and cultural / food / craft / knowledge topics.
Source: 小小东 — https://x.com/xiaoxiaodong01/status/2057338307051508107
请生成一种东方编辑美学的视觉方案:画面像铺在温润纸面上的一页克制刊物,整体安静、留白充足,却被少量高压的文字与色块牢牢钉住。不要把参考对象理解成固定题材,而要提取它的工作方式:用极大的汉字、数字或关键符号作为空间骨架,让它们可以被画面边缘裁切,只露出局部笔画、弧线、竖线和横线,像建筑结构一样支撑版面;再用极小的正文、英文注音、日期、标签、脚注或数据说明形成细密而有呼吸的阅读层级。标题不必完整陈列,可以成为画面里的形状、边界和节奏,正文则保持清瘦、疏朗、字距微开,像被认真排过的博物馆说明牌。
色彩系统以大面积低饱和浅底承载空气感,可以是米白、宣纸灰、淡粉、冷白或轻暖灰,具体温度根据内容气质调整;主内容颜色保持沉稳克制,用墨灰、炭黑、深褐、深青或低明度主题色承担信息重量;强调色只占小到中等面积,继承参考图那种“朱印式”的权威感和节奏感,但不要机械固定为红色。若内容偏学术,强调色可以变得更冷、更干净,像深蓝或铁灰中的细线;若内容偏节庆、文化、食物或手作,可以更温热、更颗粒化,像朱砂、陶土、枣红或熟橘;若内容偏科技、金融或医疗,则让强调色变得锋利、低饱和、面积更小,承担定位、警示或关键数据的职责。无论颜色如何变化,都保持原图的关系:浅底是空气,深色是文字秩序,强调色是情绪转折,灰色纹理是时间感与深度。
版式采用不完全对称的东方网格:边缘允许大字被切出画外,中心保留大片安静空白,信息块像漂浮的小岛,彼此之间有清楚距离。阅读动线不要直白从上到下,而是由大字残影、弧形或扇形纹样、细小说明文字、局部插图和底部色块共同引导,让视线在开阔与紧缩之间移动。可以加入纸纹、版画颗粒、淡淡的伞骨/扇骨/放射线/弧面纹理,作为低声背景;也可以把主体物、数据图形、人物轮廓、产品剪影或场景细节处理成水墨、炭笔、拓印、淡彩或低对比照片,使它们不喧宾夺主,而是像一枚安静证物。避免满版装饰、复杂渐变、过亮荧光、模板化卡片和商业海报式喊话。
文字设计是画面的核心:让中文、数字、英文和注释各自拥有不同尺度与语气,最大字负责视觉重量,中等字负责章节感,小字负责知识密度,英文或拼音只作为节奏性的细标。可以使用竖排与横排混合、字距拉开、局部旋转的极小标签、灰底小章、二维码式信息块、日期或编号,但都要服务于秩序,不要堆砌。最终画面应像一张可以被反复阅读的文化海报,也能自然转化为PPT封面、报告首页、信息图、排行榜、产品卡、人物专题或数据页:内容越复杂,留白越要坚定;信息越重要,强调色越要精确;主体越具象,周围越要轻。现在把这种美学用于我的实际内容,让它适合我给出的主题、文字、数据、物件或页面用途。
本次主题:{主题}
用途:ppt / 课件,请生成不低于10张图片
比例3:4
注意不是要你一张图片集合所有图片,是逐张生成。
Template D — Dark Cropped Glyph / Serious Theme
Use this as the dark-background variant of Template C. It keeps the same cropped-glyph editorial skeleton, but changes the atmosphere to dark paper, low-key historical weight, deep reds / iron gray / muted gold, and serious-report tension.
Source: 小小东 — https://x.com/xiaoxiaodong01/status/2057338307051508107
请生成一种东方编辑美学的视觉方案:画面像铺在温润纸面上的一页克制刊物,整体安静、留白充足,却被少量高压的文字与色块牢牢钉住。不要把参考对象理解成固定题材,而要提取它的工作方式:用极大的汉字、数字或关键符号作为空间骨架,让它们可以被画面边缘裁切,只露出局部笔画、弧线、竖线和横线,像建筑结构一样支撑版面;再用极小的正文、英文注音、日期、标签、脚注或数据说明形成细密而有呼吸的阅读层级。标题不必完整陈列,可以成为画面里的形状、边界和节奏,正文则保持清瘦、疏朗、字距微开,像被认真排过的博物馆说明牌。
色彩系统以暗色低饱和纸面承载空气感,可以是深墨黑、旧报纸黑、炭灰、深褐、铁灰或低明度主题色,具体温度根据内容气质调整;主内容颜色保持沉稳克制,用灰白、旧金、暗红、深青、陶土或低明度主题色承担信息重量;强调色只占小到中等面积,继承参考图那种“朱印式”的权威感和节奏感,但不要机械固定为红色。若内容偏历史、政治、革命、社会议题或严肃报告,强调色可以变得更厚重、更颗粒化,像暗红、朱砂、铁锈、旧金或深军绿;若内容偏科技、金融或医疗,则让强调色变得锋利、低饱和、面积更小,承担定位、警示或关键数据的职责。无论颜色如何变化,都保持关系:暗底是空气,亮色是文字秩序,强调色是情绪转折,灰色纹理是时间感与深度。
版式采用不完全对称的东方网格:边缘允许大字被切出画外,中心保留大片安静空白,信息块像漂浮的小岛,彼此之间有清楚距离。阅读动线不要直白从上到下,而是由大字残影、弧形或扇形纹样、细小说明文字、局部插图和底部色块共同引导,让视线在开阔与紧缩之间移动。可以加入纸纹、版画颗粒、淡淡的伞骨/扇骨/放射线/弧面纹理,作为低声背景;也可以把主体物、数据图形、人物轮廓、产品剪影或场景细节处理成水墨、炭笔、拓印、淡彩或低对比照片,使它们不喧宾夺主,而是像一枚安静证物。避免满版装饰、复杂渐变、过亮荧光、模板化卡片和商业海报式喊话。
文字设计是画面的核心:让中文、数字、英文和注释各自拥有不同尺度与语气,最大字负责视觉重量,中等字负责章节感,小字负责知识密度,英文或拼音只作为节奏性的细标。可以使用竖排与横排混合、字距拉开、局部旋转的极小标签、灰底小章、二维码式信息块、日期或编号,但都要服务于秩序,不要堆砌。最终画面应像一张可以被反复阅读的文化海报,也能自然转化为PPT封面、报告首页、信息图、排行榜、产品卡、人物专题或数据页:内容越复杂,留白越要坚定;信息越重要,强调色越要精确;主体越具象,周围越要轻。现在把这种美学用于我的实际内容,让它适合我给出的主题、文字、数据、物件或页面用途。
本次主题:{主题}
用途:ppt / 课件,请生成不低于10张图片
暗色背景,配色根据主题选择:历史 / 革命 / 严肃报告可用暗红、铁灰、旧金、深军绿;技术 / 金融 / 医疗可用冷灰、深蓝、低饱和警示色。
注意不是要你一张图片集合所有图片,是逐张生成。
Template C/D Adaptation Rules
- Default aspect for Template C/D is
portrait / 3:4 when making social cards; use landscape / 16:9 only when the user explicitly wants PPT widescreen.
- Keep visible words short: one huge cropped Chinese character / number / symbol, one medium title, a few tiny labels.
- Do not center everything. Let the biggest glyph run out of the canvas edge.
- Use small notes, dates, phonetic English, page numbers, footnotes, and data ticks as texture, not paragraphs.
- Template C uses pale paper air; Template D uses dark paper air.
- For multi-page sets, call
image_generate once per page. Never ask GPT-Image-2 to pack 10 pages into one image.
Practical Adaptation for Hermes image_generate
image_generate returns one image per call. For a multi-page PPT image set, do not ask one call to generate 10 tiny slides in one canvas.
Instead:
- Create a slide plan first.
- Render each page separately with
image_generate.
- Keep the same art direction across all pages.
- Put
Page N / Total and a small metadata line in each page prompt.
- Use
aspect_ratio='landscape' for normal PPT 16:9.
Deck Planning Rules
For N pages, use this common structure unless the user specifies otherwise:
- Cover: topic, short poetic subtitle, key visual node.
- Context: why this topic matters.
- Main object / person / concept.
- Timeline / mechanism / relationship.
- Detail page: one quiet close-up with small labels.
- Data / comparison / map / ranking if useful.
- Tension or contradiction.
- Interpretation / insight.
- Summary page.
- Closing / quote / bottom line.
For fewer pages, compress. For more pages, expand sections 3-8.
Per-Page Prompt Format
Use this compact prompt block inside the canonical template:
本次主题:
<deck topic>
页面:<N>/<TOTAL>
页面标题:<short title>
页面目的:<what this page should make the viewer understand>
可见文字:
- <main title or short phrase>
- <small metadata / date / page number>
- <1-3 short labels only>
视觉节点:
- <object / person detail / concept symbol / data node>
- <texture anchor or tiny accent detail>
构图:<diagonal / arc / left-loose-right-tight / floating center / top-light-bottom-stable>
色彩:<single main color family + tiny accent>
用途:PPT 16:9 单页图片
One-Shot Single Image Mode
If the user wants only one PPT-style image, generate one page:
- default aspect ratio:
landscape
- include 1 title, 1 subtitle, up to 3 labels
- no dense paragraphs
- use the canonical prompt directly with the user's topic
Text Rules
GPT image models can distort long text. Keep visible text short:
- title: 4-12 Chinese characters or short English phrase
- subtitle: 1 short sentence
- labels: 1-3 items
- metadata: tiny but legible, e.g.
PAGE 03 / NOTES
Avoid:
- paragraphs
- dense tables
- tiny legends
- long Chinese explanations
- copy-heavy slide bodies
If the user needs accurate long text, generate a cleaner background image first, then add text with a local HTML/SVG/PPT pipeline.
Assembly Workflow
- Extract topic, audience, page count, aspect ratio, language, and any required facts.
- If page count is missing and user asks for a PPT set, default to 10 pages.
- Build a page plan with titles and visual nodes.
- For each page, assemble the canonical prompt + per-page block.
- Call
image_generate per page.
- Save or report image paths in page order.
- Visually inspect generated images before delivery when possible.
Recommended Defaults
- Aspect:
landscape / 16:9
- Language: user's language; keep technical names in English
- Page count: 10 for PPT sets, 1 for single cover/card
- Background: warm white or pale gray-white paper
- Typography: restrained, small metadata, optional vertical text
- Color: one main soft color family; tiny accent only
Pitfalls
- One image cannot be a readable 10-slide deck: render pages separately.
- Too much text ruins the style: keep visible text minimal.
- High-saturation poster drift: explicitly reject plastic, neon, glossy commercial poster style.
- Mechanical grid drift: ask for scattered-but-intentional rhythm, not grid cards.
- Random blobs: every soft color mass needs a small anchor detail: cut, label, symbol, number, texture, or dark core.
- Inconsistent deck style: repeat the same color family, paper texture, metadata style, and visual rhythm across all pages.
- Attribution: keep source credit to 小小东 when packaging or publishing this skill.
Verification Checklist