上周OpenAI发布GPT画图2(GPT Image 2)后,我的X时间线被五种demo刷屏:火星宇航员、等距办公室场景、戴毛线帽的猫。挺酷。但我经营一家营销工具公司,真正想问的是:这东西能替代3000美元的产品摄影吗?
简短回答:可以,但提示词得对。完整回答:网上流传的大多数提示词都为"惊艳效果"优化,而非实际投放。标题需要留白。产品主图需要一致的光源。生活场景图需要看起来"不经意",而默认模型偏偏抗拒这种质感。
于是我花了几个小时,专门为广告创意写了56条提示词——产品主图、户外广告样机、带图内文案的社交广告、字体海报、平铺图、包装、品牌联名、编辑风格。全部免费开放:Soku AI的GPT画图2提示词库。
下面这7条,是我会第一天就扔给初级设计师的——复制粘贴直接用。
一、悬浮产品主图
每个DTC品牌都需要这个。诀窍是过度指定光源和表面,否则GPT画图2会默认糊成一团的工作室氛围。
「工作室产品摄影,一支磨砂玻璃护肤精华瓶配黑色滴管,悬浮于柔和的桃色渐变背景中。一滴金色精华液凝固在滴管下方坠落。右上方硬边轮廓光,柔和的反射补光,骨白色亚克力表面下方有微妙阴影。超写实微距细节:拉丝铝瓶颈、冷凝水珠、包装级画质。4:3比例,居中构图,左侧三分之一留白可放文案。」
为什么有效:明确的光源方向(右上方轮廓光)、明确的表面(骨白色亚克力)、明确的文案区域(左侧三分之一)。模型停止猜测。
二、带预制文案的生活场景广告
GPT画图2在字体处理上确实比前代强。你可以直接要求标题,它通常第一次就能搞定字间距。
「高端水瓶品牌生活场景广告。一位女性在风景优美的山径徒步,自然握持[水瓶]。广角镜头,黄金时刻光线,葱郁绿色背景。标语:'为长路而生。'粗体白色无衬线字体,画面下三分之一。照片级真实感。无水印,无额外文字。」
为什么有效:方括号占位符方便替换产品。「无水印,无额外文字」是关键——没有这条,模型会编造假品牌标识。
三、户外广告样机
提案PPT靠这些生死。别要"广告牌"——要具体的物理场景。
「照片级样机:黄昏时分时代广场一块巨型曲面LED广告牌,展示某高端护肤品牌广告——超大特写的水润面容、单支产品瓶、简短粗体字体。潮湿路面倒影,环境招牌光晕,前景模糊的黄色出租车驶过。电影感16:9,广告牌占据画面右上方,轻微广角畸变。」
为什么有效:指定了曲面LED(非平面)、黄昏(非正午)、出租车(非空旷街道)。模型理解了"热闹"而非"干净"。
四、字体海报
品牌活动需要大字报。GPT画图2对抽象排版比具体产品更听话。
「粗体极简字体海报,大写单词'RISE'占据画面中心,字体为超粗几何无衬线,奶油色文字压深炭灰背景。微妙纹理纸张,轻微压印凹陷效果。无其他图形,无渐变,无装饰。竖版4:5,文字安全边距。」
为什么有效:用「无其他图形,无渐变,无装饰」做减法约束。模型默认喜欢加东西,你得明确禁止。
五、平铺产品组合
邮件营销和社交feed的常青款。阴影方向必须锁定,否则每张图光源乱飞。
「护肤平铺摄影,三支磨砂玻璃瓶(洁面、精华、面霜)呈松散三角形摆放于未漂白亚麻布上。散落的干薰衣草枝、一小块蜂蜜色琥珀石。单一柔和光源从左上方45度角,清晰向右下方投射阴影。哑光质感, muted earth tones(柔和大地色系)。俯拍正上方视角,4:5比例,四周留白。」
为什么有效:「单一柔和光源从左上方45度角」锁定了整套图的灯光一致性。批量生成时这是刚需。
六、品牌联名视觉
两个logo同框是灾难高发区。分开指定,再要求融合。
「概念广告:户外品牌与精品咖啡联名。一只磨损的皮革登山靴置于粗犷花岗岩上,旁边是一只手工陶瓷咖啡杯,杯身有细微开片纹理。晨雾森林背景,柔和漫射光。两个品牌元素通过材质对话——靴子的皮革与杯子的釉面形成触感对比。无可见logo,仅靠设计语言暗示联名。16:9,电影感景深。」
为什么有效:「无可见logo,仅靠设计语言暗示」避开了模型胡乱生成商标的问题。用材质叙事替代品牌标识。
七、编辑风格场景图
杂志内页质感的 hardest one。需要同时控制人物、产品和环境,模型容易顾此失彼。
「编辑风格生活方式摄影,一位亚洲女性坐在中世纪现代风格客厅的焦糖色皮沙发上,手中随意握着一本精装书。前景大理石茶几上放着一台极简设计的银色笔记本电脑(屏幕关闭)。大面积落地窗透入午后自然光,窗外隐约可见绿植。色调温暖但不饱和,颗粒感胶片质感。人物看向窗外而非镜头,姿态放松。3:2比例,景深将焦点落在笔记本电脑。」
为什么有效:「屏幕关闭」防止模型生成乱码界面。「人物看向窗外而非镜头」避免了僵硬的直视镜头感。「颗粒感胶片质感」掩盖了AI生成的高清塑料感。
七个模式的共同规律
写完56条后,我总结出GPT画图2在广告场景下的真实边界:
第一,光必须被命名。说「柔和自然光」会得到随机结果,说「左上方45度角单一光源」才能得到一致性。
第二,负空间要抢。模型默认填满画面,你必须用「左侧三分之一留白」「四周留白」明确划定文案安全区。
第三,材质比形状更重要。描述「磨砂玻璃」比描述「圆柱形瓶子」更能得到准确渲染,因为模型对触感词汇的理解优于几何词汇。
第四,禁止比允许更有效。「无水印,无额外文字」「无可见logo」这类否定指令,比罗列你想要什么更能控制输出。
第五,方括号是批量生产的关键。[水瓶][笔记本电脑][护肤品牌]这类占位符,让同一条提示词可以套用在不同客户身上。
第六,比例和构图要前置声明。4:3、16:9、3:2这些参数放在提示词前半段,比放在末尾更能影响生成结果。
第七,AI感藏在完美里。颗粒、纹理、轻微畸变、不完美对焦——这些「缺陷」指令能让图像摆脱过于光滑的AI特征。
它到底能不能替代3000美元摄影?
能,但有前提。你的产品需要是标准化品类(瓶罐、电子产品、服饰),而非全新形态。你的使用场景需要可控(电商主图、社交广告、提案样机),而非需要精确物理互动的画面。你的团队需要有人能把关——提示词工程师的角色正在变成广告流程里的新岗位。
最意外的发现:GPT画图2对「广告」这个意图的理解,比Midjourney更直接。Midjourney倾向于艺术化,你需要不断用「商业摄影」「广告风格」去拉它回来。GPT画图2似乎从训练数据里学到了更多商业视觉的套路,默认输出更「能直接用」。
但别被骗。那些火星宇航员demo和你实际需要的东西,中间隔着56次迭代。我把它写成了提示词库,你可以直接拿走用。
去试试。把你的产品塞进方括号里,跑一遍这七条。然后告诉我:哪一条离你的3000美元摄影最近,哪一条还需要再磨十版。
热门跟贴