GPT Image 提示词指南

GPT Image 2 发布的同时，官方也发布了对应的提示词指南。

这篇文章对官方的指南进行总结，整理一套可直接复用的中文写法，适合 Logo、产品图、信息图、UI mockup、广告海报、图片编辑和多图合成。

GPT Image 的提示词基本公式

创建 [图片类型]，用于 [使用场景]。
主体是 [谁/什么]，处在 [环境/背景]。
画面采用 [构图/镜头/视角]，风格为 [艺术方向/品牌气质]。
配色使用 [主色/辅助色]，光线为 [光线描述]。
重点呈现 [必须清楚的元素]，避免 [不要出现的错误]。
输出要求：[比例/分辨率/透明背景/文字规则/颜色规则]。

提示词要素拆解

要素	要写清楚什么	作用
图片类型	logo、海报、产品图、图标、UI mockup、信息图、角色设定	让模型选择正确的视觉语法
使用场景	App 图标、品牌官网、社媒封面、广告落地页、演示文稿	决定信息密度和风格尺度
主体	人物、产品、动物、建筑、抽象符号	锁定画面核心
构图	居中、三分法、俯视、特写、对称、留白	控制可读性和商业可用性
风格	极简、未来感、复古、儿童绘本、电影感、3D 渲染	控制审美方向
材质与光线	金属、玻璃、纸张、霓虹、自然光、棚拍	提升质感
文字	文字内容、字体气质、是否允许文字、是否无文字	避免模型乱写字
约束	不要水印、不要多余文字、不要畸形手、不要复杂背景	降低常见瑕疵
输出规格	1:1、4:5、16:9、透明背景、可印刷、扁平矢量	便于直接使用

示例：Logo 提示词

为名为AI编的AI写小说网站设计一个原创且不侵权的标志。标志应感觉清新、简洁、有创造力。使用干净、矢量般的形状，强烈的表达欲和吸引力。倾向于简洁而非细节，以便在小尺寸和大尺寸上都能清晰阅读。平面设计，最少笔画，除非必要，否则不使用渐变。纯色背景。交付一个居中的单一标志，带有充足的填充。无水印。

这条提示词把行业、品牌气质、视觉隐喻、颜色、应用场景和禁止项都交代清楚了。模型不用猜“高级感”具体指什么，输出会稳定很多。

Logo 类提示词建议至少包含：

品牌名和行业
品牌性格：可信、年轻、高端、亲和、专业、未来感、创造力等
核心符号：字母、几何图形、自然元素、抽象隐喻
使用场景：App 图标、网站导航、包装、名片、社媒头像
颜色数量：通常 2 到 3 个主色更稳
技术要求：矢量风格、透明背景、清晰轮廓、单色可识别
禁止项：不要复杂照片感、随机文字、过多细节、水印

产品图提示词

产品图要像给摄影师下拍摄 brief，重点写清楚材质、光线、背景、镜头和留白。

生成一张棚拍产品图。
主体是一只极简白色智能音箱，放在浅灰色亚克力台面上。
使用柔和侧光和轻微反射，呈现干净的塑料材质、圆润边缘和自然阴影。
构图为三分之二特写，右侧保留留白用于后期加文案。
整体风格像高端消费电子广告。
不要品牌标识，不要随机文字，不要多余配件，不要水印。

如果要做电商主图，可以再补一句：产品轮廓清晰，边缘干净，背景纯净，适合后期抠图和排版。

信息图提示词

信息图的核心是结构。步骤、箭头、编号、标签和阅读顺序都要写出来。

创建一张简洁的信息图，用于解释“从提示词到可用图片”的 4 步流程：定义目标、描述画面、加入限制、迭代修正。
使用横向流程图布局，每一步都有一个简单图标、一个编号和一句中文说明。
配色为蓝绿色、米白和深灰，适合放入文章或演示文稿。
文字必须清晰可读，层级明确。
不要拥挤，不要过多装饰，不要水印。

信息图的文字风险更高。需要中文说明时，把每一步的文字尽量写短，并要求“清晰可读”。

UI Mockup 提示词

UI 图要像真实产品界面，模块名称越具体越好。

创建一张移动端 UI mockup，产品是个人 AI 学习教练，目标用户是自学编程的人。
页面展示今日学习任务，包含今日目标、学习进度、推荐练习、错题回顾和底部导航。
布局清晰，层级明确，间距合理，像已经上线的产品界面。
视觉风格温暖、可信、轻量，使用奶油白背景、墨绿色强调色和柔和卡片阴影。
界面文字使用中文，必须清晰可读。
不要概念艺术风，不要无意义占位文字，不要过度装饰。

做 UI mockup 时，少写“漂亮 App 界面”，多写产品类型、核心任务、页面模块和状态信息。

带文字的海报提示词

图片里需要文字时，把文案逐字写出，并说明位置、字体气质、大小关系和出现次数。

创建一张社媒活动海报，主题是 AI 创作者工作坊。
必须包含以下文字，逐字呈现：
“AI Creator Lab”
“2026 Spring Workshop”
主标题放在画面上方居中，使用粗体无衬线字体，高对比度，清晰可读。
副标题放在底部，字号小于主标题。
背景使用渐变网格和柔和光晕，风格现代科技但不过度赛博。
文案只出现一次，不要随机文字，不要水印，不要额外 logo。

如果图片不需要文字，就直接写：不要任何文字、不要随机字母、不要水印、不要额外 logo。

图片编辑提示词

图片编辑时，先锁住不能变的部分，再描述要修改的部分。

基于这张图进行编辑。
保持人物的脸部特征、姿势、服装、身体比例和镜头角度不变。
只把背景替换成明亮的现代办公室。
光线调整为柔和自然光，与人物边缘和阴影匹配。
不要改变人物身份，不要重绘五官，不要加入额外人物。

这里最关键的词是“保持”和“只”。它们能减少模型重绘整张图的概率。

多图合成提示词

多图合成要给每张输入图分配角色。

使用多张输入图进行合成。
Image 1 是主背景，保持背景、构图、镜头角度和整体光线不变。
Image 2 是要移入的对象，把它放到 Image 1 的右下角桌面上。
合成对象需要匹配 Image 1 的光线、透视、尺度、清晰度、色温和接触阴影。
不要改变 Image 1 中的其他元素，不要重绘背景，不要添加文字或水印。

多图合成最容易出问题的是尺度、阴影和透视。提示词里直接点名这些约束，比只写“融合自然”更稳。

迭代流程

生成图片时，别试图一轮解决所有问题。更稳的流程是：

第一轮只定方向，生成多个版本。
第二轮选中一个方向，固定主体、构图和配色。
第三轮只修一个问题，比如文字、背景、光线或比例。
最后一轮要求输出规格，比如透明背景、1:1、4:5、16:9。

每轮只改一个核心问题，方便判断哪条指令影响了结果。

生成前检查清单

提交前快速检查 7 件事：

图片类型写清楚了吗？
使用场景写清楚了吗？
主体和关键元素写清楚了吗？
构图、镜头、比例写清楚了吗？
风格、配色、光线写清楚了吗？
文字规则写清楚了吗？
禁止项写清楚了吗？

使用建议

写提示词时先写“用途”，再写“画面”，最后写“约束”。
商业图要多写“可用性”：清晰、留白、可缩放、无水印、无随机文字。
Logo、图标、UI 更适合要求“矢量感、网格、一致线宽”。
产品图更适合要求“棚拍、镜头、材质、反射、阴影”。
编辑图更适合要求“只改 X，保持 Y 不变”。
最后可以记住这一行：

1	用途 + 主体 + 构图 + 风格 + 文字规则 + 禁止项 + 输出规格

把提示词写成视觉需求，GPT Image 的结果会更稳定，也更接近能直接用于商业内容的素材。

附上提示词模板

1.1信息图 Infographics

适用场景： 技术解释、流程图、教学海报、时间线、视觉百科。重点是结构清楚、信息分层、文字可读。信息密集时建议使用高质量生成。

创建一张详细的信息图，用于向 [目标受众] 解释 [主题/系统/流程]。
画面应展示从 [起点] 到 [终点] 的完整流程，包括 [关键组件 1]、[关键组件 2]、[关键组件 3]。
使用清晰的分区、箭头、编号和简短中文标签，让读者能技术性地理解每一步如何运作。
视觉风格为 [干净科技/教育插画/商业简报/视觉百科]，配色为 [主色]、[辅助色] 和 [背景色]。
文字必须清晰可读，层级明确，不要拥挤，不要无意义装饰，不要水印。

1.2 图片内文字翻译 Translation in Images

适用场景： 本地化广告、UI 截图、包装、信息图。重点是只改文字，不重排、不改图形、不改 logo。

将这张图中的所有 [源语言] 文字准确翻译为 [目标语言]。
保持除文字以外的所有内容不变：图片、图标、logo、布局、层级、颜色、字体风格、字号、间距和排版位置都要保持一致。
翻译必须忠实原意，不添加额外解释，不删减信息。
如果某些文字空间不足，只允许在不破坏布局的前提下做最小必要调整。
不要改变背景、人物、产品、装饰元素或品牌标识。

1.3 自然感写实照片 Photorealistic Images

适用场景： 人物纪实、生活方式图、真实场景模拟。重点是用摄影语言，而不是“超高清”堆词。

创建一张真实自然的纪实摄影照片，主体是 [人物/对象]，正在 [具体动作]，位于 [真实环境]。
画面像真实摄影师在现场捕捉到的一瞬间，而不是摆拍广告。
加入真实细节：[皮肤纹理/衣物磨损/材质痕迹/环境杂物/自然瑕疵]。
镜头语言：[35mm/50mm/广角/中近景/特写]，[眼平视角/低角度/俯视]，[浅景深/自然景深]。
光线为 [自然日光/阴天柔光/黄昏侧光/室内窗光]，色彩自然不过度修饰。
不要过度磨皮，不要电影海报感，不要夸张打光，不要塑料质感。

1.4 世界知识场景 World Knowledge

适用场景： 历史事件、特定地点、年代复原、文化场景。重点是给出时间地点，让模型调用常识并保持准确。

创建一张写实场景图，地点是 [具体地点]，时间是 [具体日期/年代/季节]。
画面需要符合该地点和时代的真实环境、服装、建筑、交通工具、标识、道具和社会氛围。
主体事件/场景为 [事件或日常活动]。
视觉风格为纪实摄影，构图自然，细节可信。
不要出现不属于该年代的现代物品，不要虚构明显错误的建筑或服饰，不要水印。

1.5 Logo 生成 Logo Generation

适用场景： 品牌标识、App 图标、产品 logo。重点是简单、原创、可缩放、强轮廓、负空间平衡。

为 [品牌名] 创建一个原创、不侵权的 logo，品牌属于 [行业/产品类型]。
品牌气质是 [温暖/可信/高端/年轻/极简/专业]，目标受众是 [用户群体]。
图形应结合 [核心符号/隐喻 1] 和 [核心符号/隐喻 2]，形成一个简洁、清晰、容易识别的品牌标记。
使用干净的矢量形状、强轮廓、平衡的负空间，优先简单而不是复杂细节。
适合在小尺寸和大尺寸下都清楚可读，可用于 [网站导航/App 图标/包装/名片/社媒头像]。
平面设计，少量描边，不要复杂渐变；单个居中 logo，留出充足边距，纯色或透明背景。
不要水印，不要随机文字，不要模仿现有品牌。

1.6 故事转漫画 Story-to-Comic Strip

适用场景： 短视频分镜、漫画条、故事广告、儿童内容。重点是一格一个动作节点。

创建一张 [横版/竖版] 漫画分镜，共 [数量] 个等尺寸面板。
整体风格为 [漫画/绘本/轻喜剧/广告分镜]，角色外观和色彩在所有面板中保持一致。
Panel 1: [第一个清晰动作节点，包含角色、地点、表情、关键道具]。
Panel 2: [第二个动作节点，描述变化和情绪推进]。
Panel 3: [第三个动作节点，展示冲突或转折]。
Panel 4: [第四个动作节点，展示结果或反差]。
每个面板之间节奏清楚，画面可读，不要过多文字，不要面板尺寸不一致，不要角色漂移。

1.7 UI Mockups

适用场景： App 概念图、SaaS 页面、功能演示、产品提案。重点是像真实产品界面，不像概念插画。

创建一张真实可用的 [移动端/网页端/仪表盘] UI mockup，产品是 [产品名称/产品类型]，服务于 [目标用户]。
界面展示 [核心页面/核心任务]，包含 [模块 1]、[模块 2]、[模块 3] 和 [导航/按钮/状态提示]。
布局要实用、清晰、层级明确，间距合理，像已经上线的产品界面。
视觉风格为 [专业/温暖/极简/企业级/消费级]，使用 [背景色]、[强调色] 和清晰字体。
如果放在设备框中，请使用 [iPhone/桌面浏览器/平板] 框架。
文字必须清晰可读，不要概念艺术风，不要装饰过度，不要无意义占位乱码。

2.1 风格迁移 Style Transfer

适用场景： 用参考图的调色、笔触、颗粒、质感生成新主体。重点是“风格保留，内容替换”。

使用输入图片的视觉风格生成一张新图。
保留参考图的 [配色/笔触/材质/颗粒/线条/光影/构图气质]。
新主体改为 [新主体]，正在 [动作]，位于 [背景/环境]。
背景要求为 [白底/纯色/指定场景]，构图为 [居中/半身/全身/特写]。
不要复制参考图中的具体人物、logo、文字或受版权保护元素。
不要添加额外元素，保持画面简洁。

2.2 虚拟试穿 Virtual Clothing Try-On

适用场景： 电商服装预览、穿搭图、模特换装。重点是锁定身份，只换衣服，并让服装自然贴合。

基于输入人物图和服装图进行虚拟试穿。
保持人物的脸、五官、肤色、体型、姿势、发型、表情、身份和身体比例完全不变。
只替换服装为输入的 [服装 1]、[服装 2]、[鞋/配饰]。
服装需要自然贴合人物当前姿势和身体结构，呈现真实布料垂坠、褶皱、遮挡关系和接触阴影。
匹配原照片的光线、阴影、色温和清晰度，使服装看起来真实穿在身上，而不是贴上去。
不要改变背景、镜头角度、裁切、画质；不要添加新配饰、文字、logo 或水印。

2.3 草图转写实图 Drawing → Image

适用场景： 建筑草图、产品草图、场景概念、手绘转渲染。重点是保留布局、比例、透视。

把这张草图转化为写实图像。
严格保留草图中的布局、比例、透视、主体位置和主要结构。
根据草图意图补充真实材质、合理光线和可信环境。
风格为 [建筑写实/产品渲染/自然风景/室内摄影]。
不要添加草图中没有的新主体，不要改变构图，不要加入文字或水印。

2.4 产品抠图与 Mockup Product Mockups

适用场景： 电商主图、目录图、设计系统素材、透明背景产品图。重点是边缘干净、标签不变。

从输入图片中提取产品。
输出为透明背景 RGBA PNG，产品轮廓清晰，边缘干净，没有白边、黑边、毛边、光晕或残留背景。
严格保留产品几何形状、材质、颜色和标签文字可读性。
不要重新设计产品，不要改变包装文字，不要改变 logo 或标签内容。
可以做轻微清洁和抛光；如有需要，添加非常自然的轻微接触阴影，但不要出现硬切边。

2.5 带真实文字的营销创意 Marketing Creatives

适用场景： 广告牌、社媒广告、产品海报、包装营销图。重点是文案必须逐字、只出现一次、清晰可读。

基于输入产品图创建一张 [广告牌/社媒海报/产品广告/电商横幅]，场景为 [具体场景]。
必须包含以下广告文案，逐字呈现，不要多字、少字或改写：
"[准确文案]"
文字要求：[粗体无衬线/优雅衬线/手写感]，位置为 [居中/顶部/底部/右侧]，高对比度，字距干净，清晰可读。
产品需要自然融入场景，光线、透视和阴影一致。
文案只出现一次，不要水印，不要额外 logo，不要随机文字。

2.6 光线与天气转换 Lighting and Weather Transformation

适用场景： 晴天变雪天、白天变黄昏、夏季变冬季、情绪版物料。重点是只改环境条件。

把这张图的环境改成 [目标天气/季节/时间]。
只改变环境条件：光线方向、光线质量、阴影、天空、空气氛围、降水、地面湿度或积雪。
保持主体身份、物体几何、镜头角度、裁切、场景布局和物体位置不变。
新的光线和天气需要与原图透视一致，真实自然。
不要改变人物、产品、文字、logo 或主要建筑结构。

2.7 对象移除/局部修改 Object Removal

适用场景： 移除衣服图案、去掉多余物体、改局部颜色。重点是手术式局部编辑。

移除/修改输入图片中的 [具体对象/图案/颜色区域]。
只处理这个区域，其他所有内容保持完全不变。
需要自然补全被移除区域的材质、纹理、光线和阴影，使编辑痕迹不可见。
不要改变人物、服装整体、背景、构图、镜头角度、文字或画质。

2.8 把人物插入新场景 Insert the Person Into a Scene

适用场景： 故事板、广告概念、情景模拟、角色场景化。重点是保留人物身份，并避免电影海报化。

把输入图片中的人物放入一个真实可信的新场景：[新场景描述]。
保持人物身份、脸部特征、身体比例、核心外观和可识别性不变。
人物正在 [动作]，情绪为 [情绪]，与场景中的 [环境元素/事件] 发生关系。
画面应像真实照片，而不是电影海报或过度修饰的宣传图。
匹配新场景的自然光线、色彩、透视、阴影和尺度。
不要改变人物身份，不要过度戏剧化调色，不要添加无关元素、文字或水印。

2.9 多图引用与合成 Multi-Image Referencing and Compositing

适用场景： 把 A 图对象放入 B 图场景、人物与产品合成、宠物加入照片。重点是明确每张输入图的角色。

使用多张输入图进行合成。
Image 1 是 [基础场景/主背景]，需要保持其背景、构图、镜头角度和整体光线不变。
Image 2 是 [要移入的对象/人物/动物]，请把它放到 Image 1 中的 [具体位置]。
合成对象需要匹配 Image 1 的光线、透视、尺度、清晰度、色温和接触阴影。
不要改变 Image 1 中的其他元素，不要重绘背景，不要添加额外文字、logo 或水印。

3.1 室内设计精准替换 Interior Design Swap

适用场景： 家具替换、软装方案、装修预览。重点是只替换目标物，保留真实室内照片感。

在这张室内照片中，只把 [原对象] 替换为 [新对象/材质/颜色]。
保持相机角度、房间光线、地面阴影、墙面、窗户、其他家具和周围物体不变。
新对象需要符合原场景的透视、比例、接触阴影和材质真实感。
整体仍然像一张真实室内照片，而不是重新设计的效果图。
不要改变房间布局，不要添加额外家具，不要改变墙面或地板。

3.2 3D 立体节日卡片 3D Pop-Up Holiday Card

适用场景： 节日营销、印刷品预览、情绪化贺卡。重点是纸张层次、实体质感、可印刷文案。

创建一张 [节日名称] 立体贺卡/节日卡片插画。
场景：[具体节日场景与情绪故事]。
氛围为 [温暖/怀旧/浪漫/安静/童话感]。
风格为高级节日卡片摄影，具有真实纸张层次、纸纤维、折痕、轻微阴影、柔和棚拍光和浅景深。
只包含以下卡片文字，逐字呈现：
"[短文案]"
原创作品，不要商标，不要 logo，不要水印，不要额外文字。

3.3 收藏玩具/毛绒挂件 Collectible Figure / Plush Keychain

适用场景： 周边概念、IP 提案、玩具包装、电商预览。重点是原创、不侵权、零售包装质感。

创建一个 [角色/物品描述] 的收藏玩具/毛绒挂件/可动人偶概念图，展示在 [吸塑包装/礼盒/钥匙扣包装] 中。
概念主题是 [主题]，传达 [情绪/记忆/品牌感]。
风格为高级产品摄影，真实 [塑料/毛绒/金属/纸卡] 材质，棚拍光线，浅景深，包装印刷清晰，零售展示感强。
包装上只包含以下文字，逐字呈现：
"[包装文案]"
原创设计，不要商标，不要已有 IP，不要 logo，不要水印，不要额外文字。

3.4 儿童绘本角色一致性 Children’s Book Art

适用场景： 多页绘本、连续插画、角色 IP 早期设定。重点是先做角色锚点，再用同一角色推进故事。

第一步：角色锚点

创建一张儿童绘本插画，用于介绍主角。
角色：[年龄/身份/外观/服装/道具/性格]。
角色具有 [表情特征]、[身体比例]、[代表性颜色] 和 [核心道具]。
主题：这个角色会在故事中 [长期任务/价值观/行为方式]。
风格为儿童绘本插画，[水彩/蜡笔/手绘/柔和线条]，色彩温暖友好。
比例适合绘本：略大的头部、表情丰富、姿态清楚。
约束：原创角色，不要文字，不要水印，背景简单，清楚展示角色全貌。

第二步：连续故事页

继续使用同一个儿童绘本主角，角色外观必须保持不变。
新场景：[故事场景]。
动作：[角色正在做什么]。
情绪：[温暖/勇敢/紧张/安慰/好奇]。
角色一致性要求：
- 相同的 [服装]
- 相同的脸部特征、身体比例和配色
- 相同的性格气质和核心道具
风格保持儿童绘本 [水彩/手绘]，光线为 [柔和/雪地反光/森林暖光]。
不要重新设计角色，不要改变服装，不要文字，不要水印。