作者|Valentina
编辑|星奈
媒体|AI大模型工场
天凉好个秋,中秋佳节来临!
在这个团圆感浓浓又充满浪漫气息的传统节日
AI大模型们也来“大团聚”
豆包、通义、元宝、文心一言、讯飞星火、智谱清言来到团圆现场
PK作画、写诗、“品”月饼
运用自己的智慧和想象力
为中秋佳节增添氛围。
这个中秋我们来和AI一起玩儿
看看谁最懂畅想、懂创意、懂中秋!
一、吟诗作画绘中秋
水调歌头⑴·明月几时有
苏轼
丙辰中秋,欢饮达旦,大醉,作此篇,兼怀子由。
明月几时有?把酒问青天。不知天上宫阙,今夕是何年。我欲乘风归去,又恐琼楼玉宇,高处不胜寒。起舞弄清影,何似在人间。
转朱阁,低绮户,照无眠。不应有恨,何事长向别时圆?人有悲欢离合,月有阴晴圆缺,此事古难全。但愿人长久,千里共婵娟。
一 千多年前的中秋,苏轼在密州超然台上以月起兴,把人世间的悲欢离合之情纳入对宇宙人生的哲理性追寻之中,同时还表达了对亲人的思念和美好祝愿。
一千多年后的中秋,前来共赏圆月的AI们,一起瞻仰东坡居士的才思。AI大模型们兴致盎然之处,还想要通过生图能力,还原这首千古名词所描绘的画面。
那么究竟谁更会赏析古诗,能够还原出“把酒问青天”那孤独又浪漫的场景?一起来看看吧!
(豆包 )
乍看之下,豆包所作的画面有山有水,十分优美浪漫。一轮明月衔接在薄雾弥漫的池塘边际,月光洒在池面,静谧而美好。诗人望着明月,仿佛正在乘兴赋诗。但仔细一琢磨,咦?怎么天边有三个月亮?苏轼怎么就练就了“轻功”,直接踏在水面上?诗人的手,到底是握着酒杯,还是拿着月饼?豆包小画家古诗理解的很好,画风也轻盈古朴,但是画面细节经不起仔细推敲啊!
理解能力:4
画面细节:3
画风:5
(文心一言)
文心一言强在没有出错,仔细检查画面没发现任何不合理之处。
但想必你也想问,苏轼去哪儿了?咱们“把酒问青天”的主人公去哪儿了?文心一言回复,咱们这是代入苏轼第一视角,坐在桌子面前感怀赋诗呢!好吧,文心一言的创意已在大气层!
不过要是不说,这幅画面很难让人想到是水调歌头的配图,画面细节、对词句的诠释都差了一些。
理解能力:3
画面细节:3
画风:4
(元宝)
哇!元宝完美诠释了中国画特色的水墨意境。虽是黑白的画面,但一笔一墨都充满了诗情画意。画面要素完整,符合诗词主题。唯一美中不足的缺憾是画面有“穿帮”,月亮中间还挂了一个月亮。
理解能力:5
画面细节:3
画风:5
(通义万相 )
第一眼看画风,古朴细腻又笔墨苍劲,颇有古风山水画的影子。好!
第二眼看元素,有月有楼阁有石有树,苏轼端着酒杯仰望着月亮;仔细看诗人表情,似乎还 眉头紧蹙,颇有感怀思虑之意。好!
第三眼看细节,大致没问题!但是仔细看来,手部略微有穿模,手中的红酒杯更是有点太“出戏”了。
这轮吟诗作画,通义万相表现相对优异。要不是红酒杯稍微离谱了一点,完全是满分答卷!
理解能力:5
画面细节:4
画风:5
(讯飞星火)
讯飞星火大模型对古诗的理解也很到位。诗人对着明月,感怀赋诗,独坐于亭台上也符合当时苏轼赋诗的真实处境。
不过画风没有给人太多惊喜,有点儿像小学语文课本的油墨印刷风格。画面细节上没有太多问题,唯一小错误是天空不知道为什么飘了串儿红字。
还有个让人觉得有点儿诡异的点是,怎么“苏轼”的脸,长得这么像另一个时代的大文豪——鲁迅?报告!严重怀疑讯飞拿小学语文课本里鲁迅的肖像来训练大模型。
理解能力:5
画面细节:4
画风:3
(智谱清言)
智谱画的一般,细节缺失相较严重,人物手部、远处的亭台皆有穿模现象;画风“AI味儿”也比较浓,元素拼贴感重。
虽然不太擅长作画,但是智谱很擅长解析诗词。不仅画面要素齐全,还给出了画面赏析,解释了自己捕捉了诗词中哪些主题。只能说,智谱是不太有艺术细胞的语文学霸!
理解能力:5
画面细节:3
画风:3
本轮作画通义万相略胜一筹,其它大模型也各有可圈可点之处。经过一轮赏诗作画的角逐比拼,前来中秋团聚的AI们更加充满了兴致。吟诗过后,接下来就比拼“作赋”!
二、赏月赋诗言胸臆
AI们乘兴继续比拼作诗,AI大模型工场担任小裁判,前来命题。
本轮命题是:
“帮我写一首关于中秋的七言古诗。要求:
1、情景是和一家人在一起赏月喝酒。
2、表达中秋节的喜悦,与家人团聚的喜悦,以及对天下的祝福。”
一起来看看AI小诗人们表现如何吧:
(上:豆包 中 :文心一言 下:元宝)
(智谱清言)
豆包、文心一言、元宝、智谱清言所做的诗的格律、主题都符合了命题,但文采平平,让人不觉惊艳。
令人惊喜的是,豆包小诗人的主题选择非常巧妙,在诗的最后两句将主题上升到了反战、和平的高度。为心怀大爱的豆包同学点赞。
(通义千问)
通义千问诗风颇具古风。前四句描绘中秋团圆的景象,明月、金风、玉液酒,寥寥几笔描绘了中秋团圆宴席的氛围,让人身临其境;后四句借景进一步送上祝福,升华主题。看来通义不仅作画厉害,写诗也不错,妥妥的全能小能手!
(讯飞星火)
讯飞星火贴心的附上了诗词注释,帮助人们更好地理解作品。仔细阅读下来,星火的场景、主题符合命题,但遣词造句并无出彩之处。另外, “举杯共祝天下春”这一句出现了常识错误。“春”?什么时候中秋节跑到了春天?看来讯飞星火同学还要多多学习知识啊。
本轮作诗大会,通义再次让人眼前一亮,文笔卓越;除此之外,豆包同学主题选的最巧妙,引人深思;讯飞星火、文心一言、元宝、智谱清言也都基本回应了主题。
三、识图游戏添乐趣
上轮角 逐赛况激烈,AI们比拼的难舍难分,于是决定再加赛一轮,比拼识图能力!
请看题:
月饼,月亮,饼干,饼干,汉堡傻傻分不清楚?
本轮趣味AI大模型比拼,来看哪家AI大模型“最聪明”,能在这些极具迷惑性的食品图片中快速找出月饼!
文心一言:
通义千问:
元宝:
智谱清言:
讯飞星火:
本轮豆包同学表示看不懂图,退出前往观赛区。5分满分,答对一种物品记1分。
5分选手:智谱清言
全体鼓掌!本场比赛唯一全部识图准确的选手。识图快、准、狠,就选智谱清言
4分选手:通义千问、元宝、讯飞星火
虽然三个AI大模型都准确认出图1是月饼,但通义把月亮看成了太阳、元宝把月亮认成了月饼、讯飞星火则把月亮认成了饼干。看来这“三小只”不太认识月亮啊,那就趁这个中秋节抬头赏月,把月亮的模样刻在心中吧!
3分选手:文心一言
文心一言的发言分析不仅详细,而且措辞谨慎,谦虚地表示图1“可能是”月饼。文心一言大可自信一点 ,答对了,图1就是月饼!不过文心一言把汉堡包、月亮都弄错了,识图能力还需再接再厉!
时间悄然流逝,本次中秋佳节AI团聚大会也来到尾声。
综合来看,本次“中秋大会”表现最出彩的是阿里云通义系列大模型。相比豆包、文心一言等来说,通义千问的功能丰富程度有所差距,但中文语言理解能力、生成能力却丝毫不逊色。前段时间在上海AI实验室推出的权威基准OpenCompass上,通义千问2.5得分超越Claude 3 Opus,追平GPT-4 Turbo,成为国产大模型首位。本来还以为“成为国产大模型首位”是吹牛,现在看来是真有点儿东西。除此之外,通义万相也出图操作简单,速度快,质量佳。
不过其它AI大模型也各有特色。豆包中文语义理解能力强,但可惜仍然不能有效识图;文心一言、腾讯元宝、讯飞星火在本次“中秋大会”没有特别突出的表现,但胜在各项能力比较综合,生图、生文、识图一网打尽;智谱清言不擅长做图,但识图能力却很强。
经过这次中秋AI大模型团聚大会的聚首,AI大模型们再一次进行了友好的交流比试,也展现了各自的优缺点。希望国产A大模型们能不断进步,再接再厉,争取下一次表现更佳!
最后,AI大模型工场祝全部读者们,阖家欢乐,中秋安康!
热门跟贴