一键导入
ai-image-generator
AI配图能力层 Skill。任何需要生成信息图的任务都调用此 Skill,而不是自行调用 API。包含:模型选择、API调用、多视角草图流程、风格库引用、配图索引联动。触发词:「需要绘图」「生成配图」「画一张图」「制作信息图」「根据这段文字画图」「图片提示词」。
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
菜单
AI配图能力层 Skill。任何需要生成信息图的任务都调用此 Skill,而不是自行调用 API。包含:模型选择、API调用、多视角草图流程、风格库引用、配图索引联动。触发词:「需要绘图」「生成配图」「画一张图」「制作信息图」「根据这段文字画图」「图片提示词」。
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
基于 SOC 职业分类
架构/系统差距分析 Skill。将当前系统/代码库/文档与目标框架/标准/竞品对比,生成带证据链的差距报告(兼容/冲突/缺失三类),为整改计划提供输入。触发词:「对比XXX和YYY」「这两个项目有什么异同」「找出差距」「现有系统与目标有什么不对齐」「竞品分析」「和XXX相比缺什么」。
分析文章可用的多种配图视角,为每个角度生成提示词草图供用户选择。触发词:帮我分析配图角度/生成多视角草图/配图有几种选择/给我几个配图方案。
管理他山公众号的配图风格库,提供风格模板调用和新风格沉淀。触发词:调用风格库/用XX风格/存入风格库/更新风格模板/风格库有哪些风格。
按郑总的审稿标准审阅中文文章草稿,检查AI腔、标题写法(4种错误类型)、绝对表达、结构层次污染、结语完整性,逐条给出修改方案。当用户说"审稿""帮我检查文章""review一下"时使用,也可在完成文章草稿后主动执行。
追踪文章审稿意见,将编辑反馈结构化记录并逐条落实。触发词:审稿意见/修改文章/这里写得不好/审稿反馈/帮我追踪这个意见。
Bug修复循环协调者。测试完成后,读取技术问题追踪台,按P0→P1→P2顺序协调修复,每修复一个触发针对性回归测试,循环直至P0+P1全清,输出可上线结论。所有信息通过文档传递,不依赖对话历史。触发词:「全自动修复循环」「按Bug清单修复」「修复所有问题」「循环修复到上线」「开始bug修复循环」。
| name | ai-image-generator |
| description | AI配图能力层 Skill。任何需要生成信息图的任务都调用此 Skill,而不是自行调用 API。包含:模型选择、API调用、多视角草图流程、风格库引用、配图索引联动。触发词:「需要绘图」「生成配图」「画一张图」「制作信息图」「根据这段文字画图」「图片提示词」。 |
这是一个能力层 Skill,被其他 Skill 调用,不直接面向用户任务。 任何需要生成图片的 Skill 都应该引用本 Skill,而不是自行嵌入 API 细节。
| 优先级 | 模型 | 适用场景 | API Key |
|---|---|---|---|
| 首选 | qwen-image-2.0-pro | 含中文文字的信息图、结构图 | sk-68b70d6863b94c299ecd27e9d49b41ba |
| 次选 | wan2.6-t2i | 纯视觉风格图(无需复杂中文文字排版) | 同上(dashscope) |
| 备用 | gpt-image-1(DMXAPI) | 英文为主的极简图 | sk-wzI4JscScaJ1pxVKRQ4qxmJcpH1OIgsqshlP55Tq6NtZ3H5p |
选择原则:信息图/结构图/有中文标注 → 用 qwen-image-2.0-pro;纯视觉风格图 → 用 wan2.6-t2i。
wan2.6-t2i API 调用(endpoint 不同):
url = 'https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis'
body = {'model': 'wan2.6-t2i', 'input': {'prompt': 'PROMPT'}, 'parameters': {'size': '1024*1024', 'n': 1}}
⚠️ 已知问题:DMXAPI 上的 DALL-E 3 有较高概率网络超时(实测超时案例:2026-03-20 向日葵调研任务)。遇到超时时直接切换 qwen-image-2.0-pro,不要反复重试 DALL-E 3。
import requests, base64
API_KEY = 'sk-68b70d6863b94c299ecd27e9d49b41ba'
ENDPOINT = 'https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation'
headers = {'Content-Type': 'application/json', 'Authorization': f'Bearer {API_KEY}'}
payload = {
"model": "qwen-image-2.0-pro",
"input": {"messages": [{"role": "user", "content": [{"text": "你的提示词"}]}]},
"parameters": {
"n": 1,
"watermark": False,
"prompt_extend": True,
"size": "1024*1024" # 标准图;小图同尺寸,HTML 中用 max-width: 65% 控制
}
}
resp = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
img_url = resp.json()['output']['choices'][0]['message']['content'][0]['image']
# 下载并保存(URL 24 小时有效,立即保存)
ir = requests.get(img_url, timeout=60)
with open('output.png', 'wb') as f:
f.write(ir.content)
⚠️ 限速处理:遇到 429 时等待 30 秒后重试,最多重试 3 次。
风格库文件:_内部总控/产品定义/图片风格库.md(10种风格,当前文章使用 S03)
S03 标准提示词前缀(适合大多数中文信息图):
简洁专业的信息图,适合微信文章,白色背景。[内容描述]
深蓝色#1a2f5e和橙色#e8622c为主色,圆角矩形,清晰中文标注,整体简洁商务风格。
核心规则:先建立完整的对象-关系模型,再决定画什么图
在分析段落逻辑之前,先问自己:
1. 这段内容描述的「系统」里有哪些对象?
(人 / 设备 / 服务 / 组织 / 数据 / 概念阶段...)
2. 这些对象之间有哪些关系?
(数据流 / 指令控制 / 包含/被包含 / 演化前后 / 并列对比...)
3. 我现在要画的是「全景图」还是「局部图」?
全景图:展示系统所有对象及一级关系 → 优先画
局部图:聚焦某对对象的交互细节 → 作为补充
4. 如果是局部图,前面是否已经有对应的全景图?
没有 → 先画全景图,再画局部图
有 → 可以直接画局部图,但在提示词里说明「这是XX全景图的局部放大」
| 类型 | 使用时机 | 结构 |
|---|---|---|
| 系统全景图 | 展示所有组成部分及关系 | 对象节点 + 层次边框 + 关系箭头 |
| 演化状态图 | 系统随时间的状态变化 | 横向时间轴 + N个状态并列 |
| 并列对比图 | 多种方案/模式的异同 | N列相同结构 + 内容不同 |
| 层次依赖图 | 技术栈或组织的依赖关系 | 垂直叠加 + 依赖箭头 |
| 双列映射图 | 理论框架 vs 实际形态 | 左右两列 + 对应连线 |
参考图库:_内部总控/产品定义/图片参考库/架构图-全景对象关系型/
当内容涉及「人-AI协作」「多设备」「分布式」等场景时,全景图必须包含:
对象层(从下到上,或从内到外):
① 个人设备层:用户 + 本地PC + 手机
② 组织局域层:组织服务器 + 组织内成员
③ 云端层:云服务/API/OpenBrain
④ 社会层:跨组织交互/世界
关系标注:
局域网连线(实线/虚线区分)
云端上传(带方向箭头)
数据流动(带标注:数据类型/权限级别)
包含关系(用大矩形框圈定边界)
在开始绘图之前,必须先回答:
对每张图,至少从 2 个独立逻辑视角各写一条提示词:
......⛔ 禁止:只写一条提示词直接生成,跳过视角分析
按上方 API 调用格式,对每个视角各生成一张图。
生成完毕后,必须在对应文章的 配图索引_[文章名].md 中追加/更新条目:
| 图片文件名 | 对应段落 | 段落核心主旨 | 提示词摘要 | 状态 |
如果文章还没有配图索引,立即创建(模板:.cursor/skills/wechat-article-writer/templates/配图索引模板.md)。
max-width: 100%max-width: 65%<!-- 大图 -->
<p style="text-align:center; margin: 24px 0;">
<img src="data:image/png;base64,{BASE64}" alt="描述" style="max-width:100%; border-radius:8px;">
</p>
<!-- 小图 -->
<p style="text-align:center; margin: 8px 0 24px;">
<img src="data:image/png;base64,{BASE64}" alt="描述" style="max-width:65%; border-radius:8px;">
</p>
| 图类型 | 用途 | HTML 宽度 |
|---|---|---|
| 大图 | 核心结构图(坐标系、架构图、飞轮图) | 100% |
| 小图 | 辅助说明(循环图、对比图、路径图) | 65% |
| 调用方 | 调用方式 |
|---|---|
wechat-article-writer | Step 4(配图生成)引用本 Skill |
role-UI设计师 | 需要可视化时引用本 Skill |
role-产品经理 | 需要配图说明产品结构时引用本 Skill |
| 其他需要绘图的 Skill | 同上 |
根因:绘图 API 细节和多视角草图流程只存在于 wechat-article-writer,其他 Skill 无法复用。根本原因是 Skill 体系缺少「能力层」,导致执行细节散落在流程层 Skill 里。
修改内容:
验证状态:🔵 待验证
根因:AI生成的图倾向于展示「局部交互」(如单个节点的输入输出),而不是「全景图」(所有对象及其关系)。用户指出:好的信息架构图应该先展示所有对象和关系的全貌,让读者建立完整心智模型,局部图作为补充。
关键原则:「先区分对象和对象的关系,把所有对象和关系一次性呈现,而不是只展示某个局部的相互作用」——郑博元
修改内容:
_内部总控/产品定义/图片参考库/架构图-全景对象关系型/验证状态:✅ 已验证(2026-03-20 OpenClaw推文项目:全景图优先原则 + S03风格成功执行,四层架构图质量达标)
验证场景:OpenClaw 推文项目中,按「全景图优先原则」生成「四层智能协作架构图」(人层/分身层/讨论层/信源层),S03 风格,qwen-image-2.0-pro 生成。
验证结果:通过。图片直接用于公众号 HTML,无需重绘。
验证状态:✅ 已验证