实测：ChatGPT Images 2.0 vs Gemini Nano 2，谁更懂真实照片？

报错免疫体

2026-04-28 18:53 ·北京

两张AI生成的照片摆在面前，你能分清哪张是OpenAI的新模型，哪张是Google的Gemini Nano 2吗？我跑了同一组真实照片编辑任务，结果和官方宣传的"代际飞跃"不太一样。

测试方法：不做幻想场景，只碰真实照片

官方演示总爱用"独角兽在月球喝咖啡"这种提示词。但普通人真正需要的，是把一张普通照片改成另一个季节、另一种光线、另一种氛围——同时还得像真的。

这次测试全部基于实拍照片：工作室人像、产品静物、日常场景。提示词也尽量口语化，比如"把背景换成公园黄昏时分"，不喂任何技术参数。

两个工具的使用门槛几乎为零。ChatGPT Images 2.0直接在对话里让ChatGPT生成；Gemini Nano 2同样，对Gemini下指令即可。

第一组：人像背景替换，光影谁更准？

原图是一张基础工作室人像。提示词："replace the background with a park at the golden hour"。

ChatGPT Images 2.0的输出有个特点：它试图让椅子"真的"放在户外。阳光从单一方向打来，树影和人脸阴影方向一致，椅子在地面的重量感和路径纹理的透视关系也对得上。但整体氛围偏"干净"，有点像精修过的商业摄影。

Gemini Nano 2走了另一个极端。色调往深橙方向拉得更狠，"golden hour"的味儿冲得多。代价是：人物和背景的融合度稍弱，光线逻辑没有ChatGPT那么自洽。

一个像"认真还原物理"，一个像"先满足情绪预期"。

第二组：产品摄影，细节谁更稳？

产品图是AI图像生成器的传统弱项。文字、反射、材质一致性，处处是坑。

这组测试里，ChatGPT Images 2.0在保持产品边缘锐利度上小胜，但Gemini Nano 2对"氛围感"的拿捏更准——如果你要的是一张能直接发Instagram的图，而非放进电商详情页的素材。

关键差异在"可控性"。ChatGPT的输出更"正确"，Gemini Nano的输出更"有风格"。

第三组：季节与天气切换，哪里露馅？

把夏季街景改成"冬日雪景"是经典难题。AI容易犯的错：雪像撒上去的糖粉，人物穿着短袖却站在暴风雪里，或者阴影方向跟光源打架。

这一轮两者都翻车，但翻的姿势不同。ChatGPT Images 2.0的雪景物理更合理，积雪厚度、地面反光、建筑阴影基本对得上。问题是画面"太合理了"，缺乏冬天那种刺骨的冷感。

Gemini Nano 2的氛围到位了，蓝调偏色、哈气效果都有。但放大看，窗户里的室内光线和外部雪景的色温冲突明显，像是两张图硬拼。

第四组：人脸特写，AI的噩梦关卡

任何图像生成模型的终极试金石。不是"能不能生成人脸"，而是"编辑后的人脸还像不像本人"。

测试场景：给同一张肖像换发型、调年龄、改表情。

ChatGPT Images 2.0的面部一致性更好，五官比例和原图的对应关系保持得较稳。Gemini Nano 2在"年轻化"处理上更激进，但容易滑向"像这个人整容后的样子"，而非"这个人年轻时的样子"。

一个保守，一个冒险。没有绝对优劣，取决于你要的是"可识别的同一个人"还是"更好看的版本"。

第五组：文字与符号，谁更接近可用？

AI图像生成器的阿喀琉斯之踵。提示词要求生成带特定文字的海报或产品标签。

两者都未能稳定输出可读的准确文字。ChatGPT Images 2.0的字母形状更接近真实字体，但拼写错误率不低；Gemini Nano 2偶尔能凑出看起来像单词的组合，语义完全随机。

这一局没有赢家。如果业务场景涉及文字，目前仍需后期手动替换。

核心发现：两个模型在解决不同的问题

跑完所有测试，OpenAI宣传的"complete shift"并未出现。ChatGPT Images 2.0和Gemini Nano 2的差距，远不如

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴