百度旗下的文心一言自发布以来赚足了眼球,号称“国内第一、世界第二”的生成式聊天机器人。虽然在发布当天百度的港股股价下跌6%,但在次日却上涨13%,获得了资本市场的广泛认可,一时间风头无二。笔者也是有幸在发布后拿到了邀请码,本文就带你来看看,文心一言在发布会狂吹的五大核心场景(文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成)上,与基于GPT-4模型的New Bing究竟有什么区别吧~

打开网易新闻 查看精彩图片

文学创作

文心一言在发布会上演示了小说的续写能力,笔者决定反其道而行之,考察自媒体文章的创作能力。当我提问“帮我写一篇自媒体风格的文章,标题为《如何做一个爱国青年》,不少于1000字”时,文心一言给我的结果就像是一篇小学生写的作文,而且并不按照要求写1000字。

打开网易新闻 查看精彩图片

反观New Bing的回答,基本上可以用作正式的自媒体文章,十分有条理。虽然一次无法完全生成一篇文章,但是可以在结尾处续写。这里对比起来,文心一言在文学创作上逊色很多,文字组织和内容理解上还需加强。

打开网易新闻 查看精彩图片

商业文案创作

商业文案创作

作为To B业务的核心场景,商业相关的文案可能是类ChatGPT聊天机器人最吸引企业的地方。当我提问“帮我写10条黑人牙膏的营销广告,最好能够表达牙膏的美白特色”,文心一言的营销广告居然还不错,这里点个赞。

打开网易新闻 查看精彩图片

而New Bing生成的广告词却有点差强人意了,比较平平无奇。百度营销一直是百度的立身之本,这里恰恰证明了百度多年以来的营销资源沉淀能够为其提供丰富的语料库,这也是诸多企业选择文心一言的原因。

打开网易新闻 查看精彩图片

数理逻辑推算

数理逻辑推算

数理逻辑正常情况对于AI来说很简单,鸡兔同笼这种传统问题并不能证明什么。笔者决定反其道而行之,将传统的问题改为“猪狗同笼”,都是四只脚,正常情况下没有常规解。提问如下:猪和狗各有四只脚,假设有若干只猪和若干只狗关在同一个笼子里,从上面数,有25个头;从下面数,有100只脚。求笼中各有几只猪和狗?

文心一言给出的结果很意外,只给了一个特殊解:猪有5只,狗有20只。计算过程中有错误的代码,其他的结果都没有考虑到。

打开网易新闻 查看精彩图片

而New Bing直接假设了猪狗数量相等的条件,得出了没有整数解的结论。两者在这个问题上回答得都不对,可能是模型对于多解的方程没有训练过,后续可以针对性地进行调优。

打开网易新闻 查看精彩图片

中文理解

中文理解

中文理解正常来说是文心大模型的强项,毕竟百度有丰富的中文语料库。从中国传统的古诗选取命题,提问:写一首关于清明的七言绝句,希望能够表现马车在路上艰难行走的感觉。文心一言输出的结果还算符合要求,表现了雨中马车的艰难感,只是略微有点直白。

打开网易新闻 查看精彩图片

而New Bing的结果却让我意外很多,直接照搬了“清明时节雨纷纷, 路上行人欲断魂”,而且后面的缝合部分比较生硬,完全没有意境。果然还是拥有丰富中文语料的文心一言更胜一筹。

打开网易新闻 查看精彩图片

多模态生成

多模态生成

多模态生成算是百度的强项,New Bing暂时不支持这种功能。早前百度就上线了文字转图片的产品“文心一格”,文字转视频的产品“百家号TTV工具”。本次文心一言将这些外部接口通通打包接入,在发布会上的演示还算不错。实际体验下来,基本就是文心一格生成图片的能力,而很多个性化场景并不支持,会提示没有构思好作品。

打开网易新闻 查看精彩图片

发布会演示的文字转视频的功能貌似没有上线,只会生成一串代码来“将文字生成视频”。

打开网易新闻 查看精彩图片

结语

结语

从发布会提及的五大场景来看,文心一言在中文理解和商业创作上有一些小优势,但是对话式聊天机器人核心的语义理解、文字组合上与New Bing存在着不小的差距,能够明显感受到GPT-4模型对于语言的组织能力远强于文心一言,而这恰恰是文心一言需要去追赶的地方。

以上就是本文的全部内容了,你看好文心一言吗?如果你喜欢本文,欢迎点赞收藏加关注哦~

打开网易新闻 查看精彩图片