GPT-Image-2 上线,结束战斗了。

这句话看起来很标题党,但这是我过去三年来,第一次对着一个图像生成模型,说出这句话。

真的很强。拿 GPT-Image-2 跑了几个小时,生成近百张图后,我基本可以确定,它就是目前审美、文字显示、图像逻辑表现最好的模型。

OpenAI,又支棱了。

中文互联网,以假乱真

先看一个前两天就传遍朋友圈的抖音美女直播间图。

没错,这张图就出自 GPT-Image-2。提示词简单到离谱:一个美女主播在抖音直播。

打开网易新闻 查看精彩图片

除了完美复刻抖音直播间样式,最让人震惊的是这些汉字,真的,完全没蚯蚓感了❗️

打开网易新闻 查看精彩图片

我又加了个难度,让 GPT-Image-2 复刻古风美女的直播间。一般来说古风美女的直播间装扮更复杂,装饰品更多,更容易扑街。

结果图一出来,我又被它震住了。

这个古风美女直播间的页面,各种评论的汉字没问题,样式上也和真实页面分毫不差。

而且,图片审美也很在线。美女的装扮和环境、光线、色调搭配和谐,透出一种温馨雅致的感觉。

打开网易新闻 查看精彩图片

要说 Bug,我看了半天,才发现画面背景的“花”字、人物小头像,以及扇子角度有些奇怪的问题。但这种努力才能找出 AI 生图 bug 的感觉,之前哪敢想

把这几个小问题丢回 GPT-Image-2 调整。好家伙,一次性全改对了。

打开网易新闻 查看精彩图片

我又接着上难度,传了张现拍的「兰亭集序」封面,让 GPT-Image-2 生成古风美女直播卖货图。

Before

打开网易新闻 查看精彩图片

After

打开网易新闻 查看精彩图片

这次也是一次出图,啥也没改。

而且,GPT-Image-2 还读出了封面的小字,在商品链接里补上了我这是冯承素的临摹本...服了...

唯一的区别是,我线下买的时候这本只花了30块。

除了抖音,我发现 GPT-Image-2 复刻微信朋友圈也是一把好手。

输入 Prompt:生成马斯克的微信朋友圈截图,一句话说“GPT-Image-2太酷了,但不妨碍Sam Altman辣鸡”,有其他人点赞。

立刻,GPT-Image-2 徒手造就了一条当天科技圈撕B头条。

这个系列也是一个错字儿、蚯蚓字儿、蚂蚁字儿都没有。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Dario这条还出现了Ilya的点赞,合理

打开网易新闻 查看精彩图片

设计、广告,真秒出啊

拿 GPT-Image-2 做设计和广告,试下来也没压力。毕竟官方介绍,Images 2.0 是 OpenAI 首个具备“思考”能力的图像模型。

我先做了两个科技商品的拆解图,全是一次出图。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

再试试“霸王茶姬”这种消费品。

一开始模型生成的伯牙绝弦制作流程有点脑补,我让它查好之后再做一遍,内容一下子靠谱很多。

打开网易新闻 查看精彩图片

再给兰州牛肉拉面、手工现包大水饺、辣条️做个商品图。

统统,一次性拿下。

打开网易新闻 查看精彩图片

*Prompt:给手工现包的大水饺,设计一张具有高级感的、时尚的宣传图。

打开网易新闻 查看精彩图片

*Prompt:给湖南经典老式传统小吃「辣条」,设计一张高级的、时尚的产品分解宣传图。

打开网易新闻 查看精彩图片

*Prompt:给经典的兰州牛肉拉面,设计一张简约的、时尚的、具有高级感的宣传图。

IP二创,GPT-Image-2也很稳。

比如这个让雪王去其他公司做奶茶和咖啡系列,我依旧一次没改。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

注意一个小细节,雪王的胸牌只有在luckin时写了很幸运。

要说不足,现在 GPT-Image-2 在图像中的细节处理依然不是100%精细,对需要复杂逻辑规划的场景还不完美。

比如我让 GPT-Image-2 缓解这个世纪尴尬名场面,结果这个手是怎么都握不好了哈。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

但这些问题比起之前的 AI 生图,真的是小巫见大巫。

目前这个模型已经全量了,免费用户也能使用。答应我,试试看,不会后悔