文心一言开放内测申请的时候,我第一时间提交了申请。

但不太清楚百度的逻辑,我等了几天依然没有过审。

打开网易新闻 查看精彩图片

从已经参与内测的用户反馈来看,对文心一言的评价非常两极化。

一是还算不错,达到或者超出预期。

应该说ChatGPT金玉在前,给大家的震撼非常大,文心一言作为中国自己的产品,和烧了几十亿上百亿美刀的全球顶级产品有差距,非常正常。

关键要看有没有代差。

代差不是回答的问题离谱不离谱(无非是语料库训练量的差异),而是“思考”的逻辑有没有问题。

二是用嘲讽的态度来看,尤其是回答的问题出错时。

打开网易新闻 查看精彩图片

一、AI的终极任务是提高生产力

作为生产力工具,分几个方面来验证(因为我的申请一直未通过,以网友的测试效果为依据,可能不够准确)。

1、在文案设计、文字理解方面,和ChatGPT大致不相上下,百度对中文的理解力应该更好一些;

打开网易新闻 查看精彩图片

2、代码只懂一点点,作为编程工具,比ChatGPT差异巨大;

3、英汉互译尚可,百度翻译的底子还是有的,专业的翻译距离ChatGPT有一些差距;

4、逻辑思维能力比较差,这点的根源,主要还是训练量不足。

其中文案方面已经可堪商用了,可以大幅提高生产力。

但是,不太会写代码问题就比较大。

ChatGPT对代码的熟悉主要依赖于Github,微软收购了Github,几乎全球最优秀的代码都成了ChatGPT的语料库。

百度没有这个优势,也就很难在代码方面实现生产力的突破。和其他平台对接的时候,可能开发量就比较大,不像ChatGPT怼上就可以用。

ChatGPT和MS Office的结合,产生了奇妙的化学反应,Copilot可以通过AI来生成PPT,来编制Excel,打工人有了新的生产力。

我个人认为,Copilot是个非常棒的ChatGPT落地的场景展示,但Copilot本身可能是个伪命题。

让我们来模拟一个场景:乙方用Copilot给甲方画了花里胡哨的PPT,甲方要想了解其中的核心要点,再用chatpdf提炼,生成几行Word。

很可能,乙方的全套演示资料,就是这几行Word委托AI自动生成的。

为什么特斯拉的汇报改成Word而废弃了PPT和思维导图?

我想大概就是马斯克早就看透了一切。

二、为什么百度做不好文心一言

从技术上讲,我不认为文心一言和ChatGPT有太大的代差,差的可能是训练量。

但是,文心一言一定是干不过ChatGPT的。

为什么?

在ChatGPT横空出世之前,谁是AI圈的王者?

谷歌。

为什么OpenAI先于谷歌推出来ChatGPT这种强大的产品?

除了技术突破有一定的偶然性外,和谷歌本身的定位也息息相关。

谷歌现在本质上是个搜索引擎公司,靠着广告业务吃饭。如果谷歌推出来ChatGPT,那么谁还去搜索引擎看广告?

微软在搜索引擎领域,远远落后于谷歌,bing的占有率极低,所以它有足够的勇气来突破。

回到百度,其实是一回事。

搜索引擎带来的广告收入,是百度的命根子,文心一言过于强大了,谁去看广告?

基于此,我个人认为百度在AI方面可能会有很强的技术积累,但很难拿出革自己命的产品。

三、破局者:ChatGLM

谁能担当起这个重任呢?

也许ChatGLM可以。

打开网易新闻 查看精彩图片

它是由清华大学知识工程实验室 ( KEG ) 与智谱 AI 共同研发的一个大规模中英文预训练语言模型,参数 1300 亿,2022年 8 月正式对外发布。

打开网易新闻 查看精彩图片

据官方介绍,ChatGLM 参考了 ChatGPT 的设计思路,在千亿基座模型 GLM-130B 中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐(就是让机器的回答符合人类价值观、人类期望)。不同于 BERT、GPT-3 以及 T5 的架构,GLM-130B 是一个包含多目标函数的自回归预训练模型。

从某种意义上讲,OpenAI是大力出奇迹的结果,并不代表这个路线是唯一的路线。ChatGLM大致就是一个稍有不同的路线,并且这个路线充满了光明。

和OpenAI烧了十几万张A100显卡相比,ChatGLM的开源版只需要消费级显卡就可以单机部署,这才是真正令人感到震惊的。

另外,ChatGLM还支持海光、昇腾和申威,这个的意义,你懂的... ...

据测试反馈,它的编程能力还是有点强的。

打开网易新闻 查看精彩图片

开源+单机部署,想想就很兴奋。

加油!

我去买新显卡了~~