作者|杨文

来源|AI先锋官

4月16日,Create 2024百度AI开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的演讲。

李彦宏认为,大模型和生成式AI将彻底改变开发者这个群体。

“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

李彦宏还现场分享了百度在开发AI原生应用上的具体思路和工具,并表示:“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”

他强调:“大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”

会上,李彦宏正式发布了文心大模型4.0的工具版。他还透露,截至目前文心一言用户数已经突破2亿。“文心大模型已成为中国最领先、应用最广泛的AI基础模型。”

同时,李彦宏还认为:“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”

以下是李彦宏《人人都是开发者》主题演讲主要观点:

未来开发应用就像拍短视频一样简单

大模型和生成式AI,将彻底改变开发者这个群体。

过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。

打开网易新闻 查看精彩图片

这一天并不遥远,我们看到,因为有了基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了。

比如,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。

上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。

打开网易新闻 查看精彩图片

今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。

AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。

打开网易新闻 查看精彩图片

文心一言用户超2亿,文心大模型4.0工具版发布

文心一言从去年3月16日发布,到今天是一年零一个月的时间。我们的用户数突破了2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

打开网易新闻 查看精彩图片

文心一言正在改变更多人的工作和生活。

支撑文心一言的基座模型,就是文心大模型。过去一年,它经历了从3.0版本到3.5,再到4.0版本的进化。文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。

打开网易新闻 查看精彩图片

近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。

今天,我们正式发布文心大模型4.0的工具版,现在,大家可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。

打开网易新闻 查看精彩图片

不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。

打开网易新闻 查看精彩图片

大模型本身并不直接创造价值

大模型相关的话题,在2024年依然会很热,各类技术突破还会不断涌现。但我想强调的是,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。

今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。

打开网易新闻 查看精彩图片

第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,这都是有技术含量的,要针对应用的不同场景做匹配。

打开网易新闻 查看精彩图片

第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。

打开网易新闻 查看精彩图片

第三是智能体智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。

打开网易新闻 查看精彩图片

开源模型会越来越落后

因为有了最强大的基础模型文心4.0,我们可以根据需要,兼顾效果、响应速度,推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。

这样通过降维裁剪出来的模型,比直接拿开源模型调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。

大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。

-5-

视觉大模型最大的应用场景是自动驾驶

面向未来,我认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI的必经之路。

我有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度是自动驾驶的领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。

今天的中国,有10亿互联网用户,有基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持“人工智能+”行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾