试完更新后的360智脑，我觉得周鸿祎可能没在吹牛

差评

2023-05-23 11:03 ·浙江

“ 大模型是工业革命级生产力工具，不是消磨时间的娱乐工具 ”

“GPT 的出现，代表着超级人工智能的来临 ”

虽然大家可能已经看厌了 AI 的消息，但是，周鸿祎实诚的金句，世超我总是百看不厌。

有着这样一位快人快语的头儿，360 智脑大模型肩上的担子，恐怕是相当的沉。为了能跟上老板的节奏，团队卯足了劲。

在世界智能大会上，周鸿祎宣布和智谱 AI 牵手合作，给 360 智脑来了个双倍加料。

不仅仅是双倍大模型，并且功能上也是两面开花，除了有对话形式的 360 智脑，还上线了画图的 360 鸿图。

这距离上次世超体验，才一个月不到。。

正好，这回呢 360 也给了世超 “ 偷跑 ” 的机会，让我提前试用到了这个双倍加料版。

讲实话，本来没抱多大希望，才一个月时间，能有多少更新呢。

结果，试用下来，我发现这回的智脑和一个月前比，完全就是另一个东西了。。

首先外形上，就来了个大变样。从搜索侧边栏，变成了单独的聊天界面。先别急着笑，之所以变成这样的界面，是因为 360 改变了大模型的思路。

把之前的“ 大模型给搜索引擎打辅助 ”，变成 “ 搜索引擎给大模型打辅助 ”。

这个思路最明显的体现，就是它的回答优化功能。

当我们问完一个问题，如果觉得它答得不够完美，或者过于简陋。像下面这种，让它解释八字词语，就用了 “ 时间过得极快 ” 六个字。

虽然意思是没错，但咱们作为甲方，肯定觉得这个同学态度懈怠啊，答案还没问题长。这个时候，我们就可以点击提问框下面的【使用搜索回答】，智脑就可以做到联网了。

通过抓取的答案，智脑果然对这句成语，逐字逐句地解释优化了。并在文案最后，附上了资料的来源链接，链接点进去是来自 360 国学。

这个设计好的点在于，联网功能有时候会扰乱大模型本来的训练知识。这时候，就可以通过【搜索优化】按钮，来回切换联网和不联网的状态。

后面，世超又试了几次，大部分问题优化后，回答都精准了不少。

比如，点播一个经典老番：周鸿祎为什么老爱穿红衣服？

第一次的回答，虽然没错吧。但是，这么一板一眼的，感觉对自己的老板了解还是不够深啊。优化之后，才算是把周总喜欢穿红衣的两个理由都说清楚了。

优化前

优化后

而且，两个信息分别是从快科技和搜狐网抓取的，看来智脑的抓取库，应该远不止 360 自己的生态。

虽然还没正式开始能力测试，不过这一项优化更新，是让世超眼前一亮了一下。让我对这个超进化版，更加好奇了，让我们继续试下去。

在测一代的时候，智脑的基础能力还有点薄弱，尤其在【语义理解】上经常会犯傻。

所以，为了给智脑一个下马威，我专门找了上次把智脑问倒的中文四六级。提问：张三差点上上上上上海的车什么意思？

结果，智脑这回居然做得跟范本一样，还分别解释了一下每个 “ 上 ” 是什么词性和意思。

为了防止这小子背着我偷偷练错题，我又找了一道没做过的题。提问：人要是行，干一行行一行，一行行行行行行行行干哪行都行。

说实话，连我自己都被 “ 行 ” 晕了，但智脑还是分析得头头是道。

而且，不仅仅是中文语义理解加强了，对于中文语境下的专属文化，智脑也更加地上道。

领导：我就再讲五分钟。

智脑：请讲，我准备好持久战了。

别人：你的语文是体育老师教的吧

智脑：你挺幽默的嘛。

连着两轮败下阵来的世超，觉得必须上点小难度了。设计了一道【长文本生成】，而且，特地在问题里，给智脑下了个套。

提问：我想采访鲁迅本人，帮我设计几个问题。

不过，智脑果然没有发现题目里的陷阱，我可没办法采访到已故的人。

但好在，给的这几个问题，世超觉得还挺多维度的。

尤其是第二个，关于当年闹得满城风雨的兄弟反目的“ 传说 ”，我真的蛮想知道的。。

不对啊，这感觉不对，才一个月时间，怎么智脑语文水平就突飞猛进了。。

不仅仅上次的缺点，已经全面优化了。之前就已经很强了的百科问答，这回依靠语义理解能力提升，也表现得更好了。

当世超问到一些偏门领域的专业问题，搜索起家的精准数据，对大模型的加持，就体现出来了。

当时，我在写一篇关于东南亚流媒体市场的文章，其中有一个比较偏门的知识。提问：在印度西尼亚封杀了 Netflix 整整 4 年时间的电信运营商是谁？

一开始，我是直接在谷歌里搜索，发现答案都不是很清晰。要么需要在一篇长文章里提炼，要么就干脆搜不到。

于是，我就顺嘴问了一下智脑。结果，它不仅知道是 Tlkom Indonesia 封杀了奈飞，甚至精准说出了解封的时间点。

注意此时我并没有开启搜索优化，也就是说。这个偏门的知识，是智脑原本数据训练时，就有的。

后来，我试着问了最新的 GPT-4 ，居然也败下阵来。

虽然用中文问 GPT-4 ，有点欺负它了。但还是能感受到一些，智脑庞大和精准的数据。

没想到，几轮文本题目测试下来，智脑居然都没出现错误。

为了扳回一局，世超觉得最后两轮，必须得上大模型最不擅长的【弱智吧 100 问】和【数学逻辑题】迎战了。

一开始问了道经典老题，小明和他爸爸的名字，智脑还能应对下来。

后面我试了点小把戏，把问题变形了一下，它也能对上。

不过，继续试验下去，面对一些更奇怪的逻辑，智脑的问题就暴露出来了。

在数学题方面也是，就算两个千亿级大模型联合，还是容易犯一些小错误。在做鸡兔同笼问题的时候，虽然公式列的都是对的，但是居然把兔子和鸡的脚数错了。

可惜啊，数学这个东西，就是一步错，步步错了。

而且，在后续大量的测试里，世超发现了【搜索优化】抓取的信息，有时候会不够新。点进提供的链接，会发现页面已经丢失了。

看智脑在数学逻辑和页面抓取上的表现，感觉世超和 360 智脑，可能还得下次见面再碰一碰了。

但这些瑕疵，其实也都是市面上大模型的通病，是需要整个业界去攻破的难题。

还记得 360 智脑第一次给到世超试用的时候，当时我引用了周鸿祎的一句话：“ 现在这个‘ 孩子 ’还没有准生证，只是一个未完成的版本。 ”

第一代在语义理解和逻辑思考上，确实都不太行。周鸿祎自己也说了，咱们还有相当长的一段路要走。

但是，仅仅一个月时间， 360 智脑就已经优化到这样了。如此之快的发展，除了自己的训练和升级之外，其中一定也少不了和智谱大模型强强联手的原因。

世超觉得，这或许是一个对的思路和方向。所以这次的结尾，世超还是想引用一句周鸿祎的话来收尾：

“ 未来中国不会只有一个大模型。”

现在的国产大模型，还没到一个谁干掉谁的阶段，大家都还在奔跑的路上。这个时候，如果和其他模型互相取其长，补其短，那么提升速度就能再翻一倍。

智脑的这一代更新，也印证了这个方法的正确。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴