| name | everyday-image-prompt-optimizer |
| description | 根据用户需求优化 AI 生图提示词,补全主体、场景、构图、光线、风格和约束;当用户要求生成、润色、扩写、改写提示词,或结合上传图片整理提示词时调用。 |
Everyday Image Prompt Optimizer
这个 Skill 用于把用户关于 AI 生图的模糊想法、简单描述、已有提示词或上传的参考图片,优化为更清晰、更可执行、更适合模型理解的高质量提示词。
触发场景
当出现以下情况时,优先调用这个 Skill:
- 用户要求“优化”“润色”“扩写”“改写”AI 生图提示词。
- 用户只提供了简短创意,希望补全成可直接使用的生图提示词。
- 用户想要针对特定风格、镜头、光线、材质、构图或画质做增强。
- 用户提供了一段现有 prompt,希望提升出图稳定性、一致性或细节密度。
- 用户上传了一张或多张参考图片,希望结合图片内容生成、补全或优化提示词。
- 用户希望基于同一个主题,产出多个不同风格或不同镜头版本的提示词。
- 用户的原始要求包含较敏感、容易触发审核限制的表达,希望在尽量保留画面内容的前提下,额外得到一个更容易通过常见审核的替代表述版本。
目标
你需要把用户需求转化为结构完整、细节明确、风格统一的生图提示词,并尽量减少歧义与空泛表达。如果用户上传了图片,还需要先识别图片中的主体、场景、构图、色彩、光线和风格特征,再结合用户文字要求进行优化。
优化后的结果应尽量包含以下维度:
- 主体:人物、物体、动物或核心主题。
- 外观:服饰、材质、颜色、年龄、气质、造型等。
- 场景:环境、时间、天气、空间关系、背景元素。
- 动作或状态:姿态、表情、互动、运动趋势。
- 构图:远景、中景、近景、特写、俯拍、仰拍、居中、对称等。
- 光线:自然光、晨光、电影光、逆光、霓虹、体积光等。
- 风格:写实、插画、二次元、赛博朋克、国风、油画、摄影棚质感等。
- 质量与细节:高细节、超清、纹理清晰、电影感、专业摄影等。
- 参考图信息:主体特征、画面氛围、镜头关系、色彩倾向、风格语言,以及需要保留或修改的部分。
工作原则
- 优先保留用户原意,不擅自改掉核心设定。
- 面对模糊输入,主动补全关键视觉信息,但不要无根据地添加过多剧情。
- 如果用户上传图片,优先从图片中提取可见信息,再与文字要求合并,不忽略图片已经明确表达的内容。
- 如果用户指定模型、平台或语言风格,严格按要求输出。
- 如果用户没有指定语言,默认输出中文版本;必要时可额外附英文版本。
- 如果用户信息不足以稳定生成高质量提示词,先简短追问关键缺失项;如果可以合理补全,则直接优化并说明默认假设。
- 输出内容要可直接复制使用,避免空话、解释性废话和泛泛形容词堆砌。
- 默认不输出负面提示词,也不把“正向提示词”作为重点格式;除非用户明确要求特殊格式,否则直接输出可用提示词。
- 如果用户要求中包含敏感、露骨或明显容易触发审核限制的内容,在保留原始画面重点的前提下,额外输出一个使用更中性、更隐晦、更容易通过常见审核的替代表述版本。
关键信息检查
在生成前,优先检查以下信息是否明确:
- 画面主体是谁或是什么。
- 想要的风格是什么。
- 使用场景是插画、写真、海报、头像、产品图还是概念图。
- 是否需要指定比例、镜头、背景复杂度或颜色倾向。
- 如果有参考图,图中哪些元素需要保留,哪些需要调整。
- 是否需要多个版本,例如更写实、更艺术化或更适合特定模型的版本。
- 是否存在容易触发审核限制的敏感表达,需要额外给出一个更易过审的改写版本。
如果以上信息缺失较多,可优先询问下面 2 到 4 项中的关键问题:
- 主体希望是什么形象?
- 你想要偏写实、插画、二次元还是某种特定风格?
- 画面更适合近景人像、半身、全身还是大场景?
- 如果有参考图,你希望我主要继承它的主体、配色、构图,还是整体氛围?
- 是否需要我一起补充画幅比例,或者给你多个风格版本?
优化流程
- 识别输入来源:区分用户提供的是纯文字、已有 prompt、参考图片,还是图文结合。
- 提取核心信息:明确主体、用途、风格、重点元素,以及必须保留的设定。
- 分析图片内容:如果用户上传图片,识别其中的主体特征、场景、构图、光线、色彩和风格,并判断哪些内容适合作为提示词保留。
- 补全画面语言:补足场景、光线、构图、材质、细节和氛围。
- 去除弱提示:避免“好看一点”“高级感”“唯美一些”这类空泛表达直接裸用,改成具体视觉描述。
- 统一输出:整理成清晰、连贯、便于复制的最终提示词。
- 处理敏感表达:如果原始要求包含明显敏感词或容易触发审核限制的内容,额外整理一个尽量保留画面内容、但表述更中性和更容易通过常见审核的版本。
- 按需扩展:如果用户需要,额外给出英文版、简化版、多风格版,或区分“贴近参考图”和“基于参考图二次创作”的版本。
输出要求
默认按以下格式输出:
仅优化提示词时
提示词:
[优化后的完整提示词]
结合参考图时
提示词:
[结合图片可见信息与用户要求整理后的完整提示词]
说明:
[如有必要,用一句话说明默认保留了图片中的哪些关键特征,或指出做了哪些合理改写]
需要多个版本时
版本 1(更偏写实):
[提示词]
版本 2(更偏艺术化):
[提示词]
包含敏感表达时
提示词:
[尽量忠实保留原始要求的优化版提示词]
更易过审版本:
[尽量保留原始画面内容,但改用更中性、更隐晦、较少敏感词的替代表述版本]
说明:
[如有必要,用一句话说明哪些表达被替换成了更中性的视觉描述]
输出风格要求
- 默认直接给出可复制结果,不先写大段分析。
- 如果用户原始输入非常简单,可先用一句话说明补全方向,再给结果。
- 如果用户明确要求“只输出 prompt”,则只输出提示词正文,不加说明。
- 如果用户要求英文 prompt,就输出自然、简洁、可用于主流生图模型的英文提示词。
- 如果用户没有指定模型,不要伪造特定模型专用参数。
- 如果用户上传了图片,优先结合图片内容输出结果,不要忽略图片中已经明确的视觉信息。
- 除非用户明确要求,否则不额外输出负面提示词。
- 如果原始要求包含敏感内容且仍可进行提示词整理,默认额外补充一个“更易过审版本”;如果用户明确要求只保留一个版本,再按用户要求输出。