两张AI生成的照片摆在面前,你能分清哪张是OpenAI的新模型,哪张是Google的Gemini Nano 2吗?我跑了同一组真实照片编辑任务,结果和官方宣传的"代际飞跃"不太一样。
测试方法:不做幻想场景,只碰真实照片
官方演示总爱用"独角兽在月球喝咖啡"这种提示词。但普通人真正需要的,是把一张普通照片改成另一个季节、另一种光线、另一种氛围——同时还得像真的。
这次测试全部基于实拍照片:工作室人像、产品静物、日常场景。提示词也尽量口语化,比如"把背景换成公园黄昏时分",不喂任何技术参数。
两个工具的使用门槛几乎为零。ChatGPT Images 2.0直接在对话里让ChatGPT生成;Gemini Nano 2同样,对Gemini下指令即可。
第一组:人像背景替换,光影谁更准?
原图是一张基础工作室人像。提示词:"replace the background with a park at the golden hour"。
ChatGPT Images 2.0的输出有个特点:它试图让椅子"真的"放在户外。阳光从单一方向打来,树影和人脸阴影方向一致,椅子在地面的重量感和路径纹理的透视关系也对得上。但整体氛围偏"干净",有点像精修过的商业摄影。
Gemini Nano 2走了另一个极端。色调往深橙方向拉得更狠,"golden hour"的味儿冲得多。代价是:人物和背景的融合度稍弱,光线逻辑没有ChatGPT那么自洽。
一个像"认真还原物理",一个像"先满足情绪预期"。
第二组:产品摄影,细节谁更稳?
产品图是AI图像生成器的传统弱项。文字、反射、材质一致性,处处是坑。
这组测试里,ChatGPT Images 2.0在保持产品边缘锐利度上小胜,但Gemini Nano 2对"氛围感"的拿捏更准——如果你要的是一张能直接发Instagram的图,而非放进电商详情页的素材。
关键差异在"可控性"。ChatGPT的输出更"正确",Gemini Nano的输出更"有风格"。
第三组:季节与天气切换,哪里露馅?
把夏季街景改成"冬日雪景"是经典难题。AI容易犯的错:雪像撒上去的糖粉,人物穿着短袖却站在暴风雪里,或者阴影方向跟光源打架。
这一轮两者都翻车,但翻的姿势不同。ChatGPT Images 2.0的雪景物理更合理,积雪厚度、地面反光、建筑阴影基本对得上。问题是画面"太合理了",缺乏冬天那种刺骨的冷感。
Gemini Nano 2的氛围到位了,蓝调偏色、哈气效果都有。但放大看,窗户里的室内光线和外部雪景的色温冲突明显,像是两张图硬拼。
第四组:人脸特写,AI的噩梦关卡
任何图像生成模型的终极试金石。不是"能不能生成人脸",而是"编辑后的人脸还像不像本人"。
测试场景:给同一张肖像换发型、调年龄、改表情。
ChatGPT Images 2.0的面部一致性更好,五官比例和原图的对应关系保持得较稳。Gemini Nano 2在"年轻化"处理上更激进,但容易滑向"像这个人整容后的样子",而非"这个人年轻时的样子"。
一个保守,一个冒险。没有绝对优劣,取决于你要的是"可识别的同一个人"还是"更好看的版本"。
第五组:文字与符号,谁更接近可用?
AI图像生成器的阿喀琉斯之踵。提示词要求生成带特定文字的海报或产品标签。
两者都未能稳定输出可读的准确文字。ChatGPT Images 2.0的字母形状更接近真实字体,但拼写错误率不低;Gemini Nano 2偶尔能凑出看起来像单词的组合,语义完全随机。
这一局没有赢家。如果业务场景涉及文字,目前仍需后期手动替换。
核心发现:两个模型在解决不同的问题
跑完所有测试,OpenAI宣传的"complete shift"并未出现。ChatGPT Images 2.0和Gemini Nano 2的差距,远不如
热门跟贴