with one click
gpt-image-2-handdrawn-diagram
// Use when generating high-readability hand-drawn knowledge diagrams, architecture diagrams, workflow maps, or consulting-style visual explanations with GPT-Image-2 via image_generate.
// Use when generating high-readability hand-drawn knowledge diagrams, architecture diagrams, workflow maps, or consulting-style visual explanations with GPT-Image-2 via image_generate.
Use when generating PPT-style image slides, poetic presentation covers, quiet paper-texture visual pages, report pages, invitations, social cards, or slide-image sets with GPT-Image-2 via image_generate.
可独立运行的 GPT-Image 增强版 EPUB2Podcast:在本地把 EPUB 转成双人中文音频、GPT-Image/Smart Slide 视觉页、最终 MP4,并生成 YouTube 发布素材。
可独立运行的 standalone 版 EPUB2Podcast:用户只需下载当前项目本身,即可在本地把 EPUB 转成 Smart Slide + 双人中文音频 + 最终 MP4 视频播客。
【Ark Agent Plan 专用版本】EPUB 转双人中文播客视频流水线:使用火山引擎 TTS(与 Seedream/Seedance 共享技术栈),Smart Slide + 双人音频 + 最终 MP4 视频,无需额外 Google/OpenRouter API Key。
【Ark Agent Plan 专用版本】Manim 数学/算法讲解视频完整流水线,使用火山引擎 TTS 中文旁白(与 Seedream/Seedance 共享认证)。Plan → TTS → Code → Render → Stitch → Deliver. 适用于:Manim 动画 + 中文配音、音画同步讲解视频、3Blue1Brown 风格教学视频。
【Ark Agent Plan 专用版本】基于 Remotion 的英文词汇视频自动化生成流水线。输入一个英文单词,自动完成:诊断、火山引擎 TTS 音频(与 Seedream/Seedance 共享认证)、节奏分割、视频渲染、飞书上传和成本汇报。
| name | gpt-image-2-handdrawn-diagram |
| description | Use when generating high-readability hand-drawn knowledge diagrams, architecture diagrams, workflow maps, or consulting-style visual explanations with GPT-Image-2 via image_generate. |
| version | 1.0.0 |
| author | Hermes Agent |
| license | MIT |
| platforms | ["linux"] |
| metadata | {"hermes":{"tags":["gpt-image-2","image-generation","handdrawn","infographic","architecture-diagram","workflow"],"related_skills":["baoyu-infographic","architecture-diagram"],"source_author":"小小东","source_homepage":"https://x.com/xiaoxiaodong01"}} |
This skill turns text, architecture notes, workflows, or reference diagrams into a high-readability hand-drawn knowledge diagram.
Use Hermes image_generate for rendering. In this environment, image_generate is backed by GPT-Image-2, so do not route this workflow through another image generator unless the user explicitly asks.
The core pattern comes from 小小东's GPT-Image-2 article: lock information design first, then visual style. The goal is not cute decoration. The goal is: core judgment first, modular reading path second, memorable bottom line last.
Source credit: 小小东 — https://x.com/xiaoxiaodong01
Use this skill when the user asks for:
Do not use when the user needs a machine-verifiable topology diagram. For that, Mermaid / PlantUML / SVG architecture diagrams are safer.
Collect or infer these fields:
topic: diagram title/topicaudience: target reader, e.g. PM / boss / client / engineerscore_judgment: one-sentence takeawaymodules: 3-6 modules, each with 3-5 short bulletsflow_summary: one-line bottom summaryaspect_ratio: default 16:9language: default follows user language; keep technical terms in original EnglishIf content has more than 8 modules, split into multiple diagrams. Do not force 10+ modules into one image.
Use this as the base template. Replace the final {请输入你的内容或者参考图片} block with structured content.
请把我提供的内容转化成一张高可读性的手绘知识图解。风格像认真整理过的创意手帐 + 白板推演 + 咨询报告信息图,而不是冰冷模板。
【输出目标】
生成一张适合传播、汇报和复用的知识图解。它必须先让人抓住核心判断,再沿着模块逐步阅读,最后记住一句结论。
【语言要求】
图上所有可见文字根据用户的输入来确定语言,中文,英文或其他
不要混用语言,除非是技术名词、产品名、协议名、代码路径或数字指标。
【画布要求】
比例:{16:9 / 5:4 / 4:3 / 21:9}
质量:4K high resolution
背景:浅米白 / 浅暖灰,保留轻微纸张纹理和呼吸感。
整体清晰、留白稳定,不要把文字挤到看不清。
【信息设计规则】
不要逐字搬运原文。先压缩信息,再画图。
请把内容整理成:
1. 顶部:强标题 + 一句话核心判断
2. 中部:3–6 个主模块,按流程、对比、阶段或因果关系排列
3. 模块内:每个模块最多 3–5 条短 bullet
4. 底部:一条 Flow Summary / Decision Summary / Bottom Line
5. 如果内容很多,只保留最关键的 8–10 个判断,避免微型文字
【可读性规则】
标题必须最大、清楚、有重量。
模块标题要有秩序,正文必须短句化。
每个模块不要超过 6 行正文。
每条 bullet 尽量简短。
不要使用密密麻麻的小字表格。
不要为了完整而牺牲可读性。
【视觉风格】
黑色或深墨色手写线条建立阅读骨架。
使用圆角分区、细线框、轻阴影、编号、箭头、标签和小图标。
线条允许轻微手绘抖动,但整体对齐、边距、分组要稳定。
图标只做路标和强调,不要抢走文字层级。
【配色规则】
使用克制的标记笔色彩:
浅米白背景 + 黑色主线条;
低饱和青绿、鼠尾草绿、淡紫、柔橙、浅蓝作为分区和路径颜色。
避免霓虹色、强渐变、过度商业光效和整页单色化。
彩色区域只占少量到中等面积。
【准确性规则】
严格保持输入内容中的技术链路、组件名称、箭头方向、协议、端口、数据流和判断。
不要自行新增未提供的组件。
不要把动作写错,例如“读取日志”不能画成“生成日志”。
如果空间不足,优先保留主链路、关键差异和最终判断,删掉次要解释。
【内容】
{请输入你的内容或者参考图片}
image_generate directly with the assembled prompt.aspect_ratio='landscape' for 16:9, square for 1:1, portrait for 9:16.Use this compact block inside 【内容】:
主题:<topic>
读者:<audience>
核心判断:<one sentence>
画布:16:9,中文,技术名词保留英文
阅读路径:从左到右,输入 → 解析 → 生成 → 渲染 → 交付;关键保障放在侧边便签。
模块 1:<title>
- <short bullet>
- <short bullet>
- <short bullet>
模块 2:<title>
- <short bullet>
- <short bullet>
- <short bullet>
底部总结:<flow_summary>
image_generate.