全文 2,000字 | 阅读约 6 分钟

打开网易新闻 查看精彩图片

(OpenAI官方发布会片段)

2026 年 4 月 21 日,OpenAI 发布 ChatGPT Images 2。发布会上,Sam Altman 说这个模型开始会“思考”。听着挺虚,但看完演示,会发现这次升级确实不太一样。

它开始能够往前多做了一步:先想,再画。

什么意思?

过去,你先想清楚要什么,AI 帮你做出来。 现在,AI 先帮你把“想”这一步做完,再出结果。

这次发布最值得关注的,不是 Imagine 2画得有多真,是这一步到底怎么发生的。

第一节|它在“想”什么

AI 图片工具已经从单纯的解决“怎么画”,变成了现在“先想什么、再做什么”。

Sam Altman 在现场明确表示:Imagine 2 在生成图像之前,会先进行一轮思考,甚至主动检索信息,再将结果组织成视觉画面。图像不再是死板地依赖一句提示词直接生成,中间多了一层内容梳理的过程。

它会开始主动问:哪些信息需要放进去、以什么顺序呈现、最终输出什么结构图片。

在现场,团队演示了用一张自拍生成整套杂志封面和仅凭一个提示词直接生成三页漫画。角色风格、情节发展和版式安排都保持高度一致。核心在于 Image 2 拥有一套完整的逻辑思考能力:第一页建立人物,第二页推进情节,第三页收拢故事。这套原本需要人类一步步构思的流程,现在被模型放进一次生成动作里。

这种思考能力不仅体现在叙事能力上,也延伸到了排版设计。

团队成员提到,模型会自主决定文字的位置,输出一个高完成度的设计版面。换句话说,它已经在替你做设计取舍了。过去你需要反复微调标题位置、段落层级、图文关系,现在它在生成时就安排妥当,且大多数情况下都符合设计常理。

另一个容易被忽视的隐秘升级能力,是模型自我校验机制。OpenAI 研究员透露,模型会在最终输出前检查自身生成的结果,以确保多张图片之间的一致性。这听上去只是个微小的能力提升,但在实际业务场景里,意味着那些需要反复修改、对齐、核准的繁琐步骤正大幅减少。

演示中还有一个极其亮眼的环节:团队让模型去搜索社交媒体上对测试版本的反馈,整理成一张图,甚至在图里生成了一个可以直接跳转chatgpt.com的二维码。现场有观众扫码验证,确实有效。

将这些碎片拼凑起来看,这次升级是把几件原本散落在不同工作阶段的任务,压缩成了一个连续的过程,交由同一个系统一站式完成:查资料、理信息、排结构、统风格、做校验。

所以,所谓“先想一步”,本质上是替人类砍掉了哪些需要反复推敲、修改和试错的中间环节。

第二节|为什么是现在

OpenAI 为什么在这个时间点,将重心转移到了这件事上?

最直接的信号,是他们对产品定位的表达变了。在整场发布中,团队不再刻意强调生成效果有多好玩或惊艳,反复提及的是具有经济价值的创意任务。说白了,就是产出能直接投入业务流、甚至直接带来转化的资产。从这个角度看,OpenAI的关注点已经从生成效果转向了商业实用性。

就在一个月前,OpenAI刚宣布关停曾经爆火的Sora视频应用,理由是要专注于企业级的核心业务。现在转头押注图像,表面看像是战略摇摆,但底层的逻辑其实很清晰:视频固然更抓人眼球,但图像、排版、信息图表,才是日常工作中最高频、也最能无缝接入实际业务流的刚需。与其让用户反复抽卡生成好看的废片,不如让他们更快拿到能直接用的结果。

产品负责人 Adele Li 说过:创意 AI 助手最终会成为个人生活不可或缺的一部分。

往深了看,这一步也和 OpenAI 整体的产品方向一致。从写作、编程,再到如今的图像设计,每一块能力都在往同一个方向走:尽可能减少中间步骤,让一个人可以更快把事做完。过去,你需要在不同的软件之间来回切换,一步步把内容拼出来。

现在,这些分散的环节开始被整合到一个连续的流程里,由同一个会“先想一步”的工具来完成。

从这个角度看,AI 正在从提供工具,变成直接交付结果。

第三节|会改变什么

那些演示,其实已经给出了答案,只是大多数人还没把它和自己的工作连在一起。

比如,一次性生成完整的杂志排版、分镜连贯的三页漫画、成套的社交媒体宣发物料,甚至是一份结构清晰的学习指南。这些内容看似只是展示效果,但换个角度问一句:过去,是谁在生产这些东西?

  • 是文案在反复修稿,

  • 是设计师在一版版微调像素,

  • 是运营在将素材拆分重组。

这些工作未必有多高深,但极度繁琐,且每一个任务都需要耗大量精力。

如今,这些步骤开始被跳过了。你不再需要先写一版文案,再丢给设计排版,然后反复沟通改来改去。AI 直接给你一个已经整理好的版本。它未必完美,但基本上能用了。

以前,人负责想,机器负责执行。现在,机器开始分担一部分的“想”,人要做的,是在机器想完之后,做出判断。

这将彻底重塑职场对“专业能力”的定义。

过去常说一个人专业,是因为他精通软件、懂排版、抠细节;以后更重要的,可能是你能不能把需求说清楚,能不能看懂一份结果哪里合适、哪里需要推翻重来。

技能的半衰期,正在以肉眼可见的速度缩短。

说到底,工作本身并没有消失,只是完成它的方式变了。面对同样的商业需求,有的人还在苦哈哈地从零起步,而有的人,已经站在了一个初步成型的结果上开始做微调。

这中间的效率差,就是新周期的第一波红利。

结语|差距在哪里

回头看,这次变化的核心其实很简单。

图像还是图像,工作还是工作。真正改变的,是那段原本需要人反复去磨的中间环节,被模型提前处理掉了。

当 AI直接交出一个能用的版本,你要做的事情就变了。

不再是从零开始做,而是从一个已经成型的东西开始改。

这一步看似不大,但一旦成为常态,人与人差距就会被进一步拉开。

识自AI

本文由AI深度研究院出品,内容整理自OpenAI官方发布会、CNET、Neowin等媒体报道及网上公开素材,属评论分析性质。内容为观点提炼与合理引述,未逐字复制原发布材料。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.youtube.com/watch?v=sWkGomJ3TLI&t=1163s

https://www.cnet.com/tech/gaming/todays-nyt-connections-hints-answers-and-help-for-april-21-1045/

https://chatgpt.com/images/

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵