最近对各家大模型的分析能力有点好奇,恰好遇到一个问题,就拿来测试了一下。

前几天阿川和梵蒂冈那位闹矛盾了。4月12号晚上,阿川先发了一篇长贴,猛烈批评梵蒂冈那位。然后他发了一张AI图,画像上阿川变成了某历史人物,他在光环里拯救世界。

谁知这张照片引发了信众的大规模反弹。第二天阿川不得不删了这张照片,但他对记者解释说:“我是想表现自己像个医生在治愈民众,这张画和红十字会有关。只有‘假新闻’才会把这解读成别的意思”。

看了他的发言我有点困惑:“难道大家一开始都理会错了?”我想AI应该是比较客观的,于是我挨个问了一下AI。

先问了谷歌旗下的Ge,因为不少人反映它表现不错。但它扭扭捏捏,不直接回答我的问题,而是貌似中立地说:“不同的人有不同的解读。”去!那我要你干什么?

又问了Ch 。本来它是我的心头好,还花钱买了高级版。但它不思进取,经常不搜最新信息,屡次把我带到沟里,我不得不专门写了一篇“我是如何被打脸的”。Ch 居然说:“没有公开记录显示最近阿川与梵蒂冈那位发生争论”。天哪,现在AI界这么卷,信息还如此落后,不被休了才怪。

再问马斯克手下的Gr。它有时候不错,但它有两个特点,一是它被马斯克手调过立场取向,二是它较多采用马斯克手下X上的发言。

Gr的结论是:“说实话,这事最真实的解读就是:阿川想发个霸气图,结果玩脱了,临时找了个台阶下。”哦,是这样!感谢你实话实说。

再问Deepseek,我希望它在中文语义理解上有优势。Deepseek 不像平时好多问题不能谈,马上直截了当地回答:“这是他在被质疑后找的一个借口,而不是大家看错了。”

它的具体分析很好,我拷贝过来给大家看看:

「· 逻辑漏洞:图中已明确出现穿现代手术服的护士,说明作者能区分“医生”与“神圣形象”。若真想画医生,没必要用白袍红披肩。

· 艺术常识:手部金光、头顶光环是神圣艺术中“神圣治愈者”的专属符号。艺术史教授亦指出,医生不会在圣光中悬浮治疗。

· 时机敏感:此图在他刚激烈攻击对方、骂其“软弱”后很快发出,转身就发救世主形象,难以视为巧合。」

Deepseek最后语重心长地说:「你看,他删图是为了平息事态,但他拒绝道歉,甚至还在继续攻击梵蒂冈那位。这种“删图但不认错,反而怪媒体曲解”的做法,非常符合他一贯的叙事逻辑。」

哇,没想到Deepseek 逻辑如此清晰,给一个赞。

最后问了我的新宠小C 。它有点学者风貌,客观地一一分析了三种可能性,并指出“但图片里既没有红十字会的标志,也没有任何明显的'医生'元素”。

小C得出结论是:「最理性的解释是:这是一个有意为之的挑衅性姿态,目的是在与梵蒂冈那位对立的语境下彰显某种”神圣权威”感——这与他的政治叙事完全吻合。遭遇强烈反弹(包括来自自己阵营)之后,“医生”的说法是一个临时找的台阶,而非真实意图。」小C 这种长句子的说话语气是不是也有点书生气?

这个平行对比的小测验挺有意思的,这次的表现总结在下面的表格里了。

打开网易新闻 查看精彩图片

但要注意的是,这些AI在不同议题上的表现并不一致,今天好的,明天就可能翻车。只有不带偏见地客观提问,并让几个AI交叉验证,我们才能得到比较准确的信息。

1,

2,