导语:应用的进步,可以推动基础模型的创新

| 陈世锋

2024年5月22日,第八届VivaTech在法国巴黎凡尔赛门展览中心隆重举行。会议期间,来自全球各地的参会者们认真倾听数百个独一无二的创意,不断激发科技改变世界的梦想,气氛非常热烈。

VivaTech全称Viva Technology,是欧洲最大科技创新盛会,堪称欧洲AI春晚。历届大会中,法国总统均到场出席,谷歌、微软、IBM、三星、特斯拉等各个科技巨头的董事长和CEO也是大会常客。

作为世界领先的科技和创新展览之一,2023年第七届VivaTech大会吸引了来自174个国家的15万名参观者、1.14万家初创企业和2800家参展商,同时还有40.5万人通过网络在线观展,9亿多社交媒体用户关注。

目前正在召开的第八届VivaTech大会,有超2500家初创企业和2000名国际投资者,25个行业和350多家公司和组织参与,全球多个明星公司和顶级嘉宾出席,包括特斯拉CEO马斯克、图灵奖得主Yoshua Bengio、Meta首席科学家Yann LeCun、Anthropic首席执行官Dario Amodei、法国AI独角兽Mistral AI CEO Arthur Mensch、Salesforce AI CEO Marc Benioff等一众AI大佬,法国总统马克龙也应邀参会。

值得关注的是,中国展区将作为本届VivaTech亮点之一重磅回归,百度创始人、董事长兼首席执行官李彦宏作为大会唯一受邀发言的中国AI领袖,在主论坛“炉边谈话”与VivaTech联合总裁展开对话。VivaTech大会的推文中,将李彦宏称为“长期的AI支持者”和“中国AI的头号玩家”。

“很多人都在关注GPT-5的发布时间,但我更感兴趣的是,哪些应用可以充分利用大语言模型的所有能力。”李彦宏在与阳狮集团监事会主席莫里斯•列维(Maurice Levy)对谈时表示,中国AI与西方的最大区别在于应用,中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。他介绍说,应用驱动了中国AI的快速发展。

在李彦宏看来,关注应用并非是忽视基础模型的发展,与之相反,AI应用与基础大模型的发展相辅相成。应用的进步,可以推动基础模型的创新,也有助于加快从互联网时代向人工智能时代的转变。

“我是人工智能的长期信仰者。所以在十多年前,我们就开始积极投入研发人工智能,尤其是与自然语言相关的人工智能。”李彦宏表示。

01

中国AI的头号玩家

一直以来,李彦宏信仰技术,他曾在公开发言中表示,“技术是我们的信仰,百度走到今天,是因为我们信仰技术,我们觉得技术可以改变世界。”早在30年前,李彦宏在北大读书期间就对AI抱有浓厚的兴趣。李彦宏创立百度后,在确立了中文搜索引擎的绝对优势后,他意识到AI是解决搜索引擎问题的核心技术,因为两者的本质,都是让机器理解人类语言。“所以在十多年前,我们就开始积极投入研发人工智能,尤其是与自然语言相关的人工智能。”

2023年,《时代》周刊发布了首届全球百大AI人物,李彦宏与特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等人被评为全球AI领袖,是该榜单中唯一入选的中国企业家。《时代》周刊在介绍李彦宏时表示,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。”(As China’s foremost futurist, Robin Li has been riding the AI wave for a long time.)

李彦宏对AI抱有极大的热情。在2024年的一次内部讲话中,李彦宏表示,“大模型我们走在最前面,我们要去勇闯无人区,需要去冒前人没有冒过的风险。”……“十个创新,可能九个最后都是以失败告终的,但我们不会放弃,我们会去做第11个、第12个……我相信终有一天,我们会向世界证明,技术是有价值的。”

经过十多年的布局,百度在AI研发方面投入近1700亿元,创造了一系列突出的技术成果,持续引领中国AI浪潮。李彦宏介绍说,百度于2019年推出1亿参数规模的文心大模型1.0版本,在2.0版本升级至10亿参数,ChatGPT发布后不久,即推出了3.0版本,发布速度远超全球其他上市公司,“是因为我们准备得更加充足、工程师非常努力,我们一直在朝着这个方向努力。”

在AI原生应用方面,百度在全球科技大厂中首个推出中文大语言模型应用——文心一言。文心一言开放首日即回答了用户3342万个问题。开放后12小时,文心一言迅速登上Apple Store免费应用排行榜首位,成为首个登顶应用商店榜首的中文AI原生应用。

在文心一言的帮助下,广大用户“解放了生产力”。某昵称为“1952的野生”知乎博主表示,文心一言激发了他的创作想法,可以快速润色内容。“我觉得文心一言对我的帮助主要体现在两个方面,一个方面是解放,另外一个方面是自信。”

文心一言也创造了新的“工作岗位”。一位18岁的实习提示词工程师Mio,在短短两个月内疯狂写提示词,成功上线了100多个,顺利成为AI行业的从业者之一。他认为,“文心一言可以说是直接改变了我的生活方式。原来我只是一个爱好者,靠着文心一言我现在竟然成为了一个从业者,这是我一年前不敢想的。”

近期,新东方英语名师、孟羽童等知名人物也先后入驻文心一言APP。根据李彦宏在2024百度AI开发者大会上披露的数据,发布一年多以来,文心一言用户已经突破2亿。与2023年12月相比,其用户规模足足翻了一倍。

百度还在2013年就已经开始布局自动驾驶。李彦宏在2024百度AI开发者大会上透露,“视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。”

2017年,百度对外开放了国内第一个自动驾驶平台Apollo(阿波罗)。根据全球领先的法律和商业分析商“律商联讯LexisNexis”最新发布的《驶向未来:自动驾驶创新洞察》(Driving Toward Tomorrow:A Deep Dive Into Autonomous Vehicle Innovation)报告,百度自动驾驶在专利资产指数、专利包规模等多项排名上位列全球榜首,展现了创新技术与商业化的成功结合。

公开资料显示,百度Apollo L4级自动驾驶安全运营测试里程累计已超1亿公里,自动驾驶牌照数量超过1000张,已经成为智能化汽车时代的“卖水人”。
此外,百度还力图成为AI领域的“黄埔军校”。2020年6月,百度宣布未来5年预计培养AI人才500万,到2024年4月,百度宣布该计划已经提前完成。但百度还在持续发力AI人才培养,2023百度世界大会上,百度又公布了人才培养星河计划,将为社会再培养500万大模型人才。

一直以来,百度都在不断提升大模型的效率和效果,降低大模型的成本和门槛,让更多人享受到AI的时代红利。2024年5月21日,百度甚至宣布将ERNIE Speed、ERNIE Lite两款大模型免费。

由于其在AI领域的突出贡献,2023年11月21日《财富》发布的首届全球“《财富》人工智能创新者50强榜单”(Fortune 50 AI Innovators)中,百度成为唯一入选该榜单的中国企业,同时入选50强的还有微软、谷歌、OpenAI等全球知名科技企业。
《财富》在对百度的评语中指出,百度文心大模型4.0在成熟度和功能上与OpenAI的ChatGPT不相上下,并在多项中文特定任务中超越了ChatGPT。

经过十年的磨砺,百度AI逐渐展露锋芒。正如李彦宏所说,“人们总是高估技术的短期价值,低估技术的长期价值,”……“坚定的信仰和持久的坚持,让我们实现颠覆性创新”。他还表示,“2023年已经看到了通向通用人工智能的曙光,2024年我们熬过去,就能够化茧成蝶。”

02

AI应用驱动基础模型创新

AI大模型能够理解人类的自然语言表达,并通过庞大的网络结构实现具有针对性的内容输出。从效果上看,生成式AI表现为“无所不知、无所不能”,其具备了逻辑推理、上下文理解、文字创作、知识提取、代码生成等非常多元化的强大能力,但这取决于大模型的训练程度。

一位业内人士表示,“通过中文或英文数据训练出来的大模型,差异还是比较大的,中文的上下文理解和语义的多解性要大于英文。”因而,以中文“投喂”大模型的中国科技大厂在这个方面具有天然优势。

在目前全球各类大模型评测榜单中,国内大模型均在TOP10中长期占据半数席位,其中百度文心大模型、阿里通义千问、智谱GLM-4等更是稳居TOP5,在理解、逻辑、记忆等整体能力上保持在世界一流水平,更在中文理解与创作上具有显著优势。

值得一提的是,得益于百度四层技术栈的独特优势,芯片、框架、大模型和终端应用场景能够形成高效的反馈闭环,能够帮助大模型不断调优迭代。相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

根据2024年3月国内人工智能权威机构清华大学基础模型研究中心发布《SuperBench大模型综合能力评测报告》,在人类对齐能力评测中的中文推理和中文语言,以及语义理解中的数学能力和阅读理解能力等方面,文心大模型具有明显优势。李彦宏在大会上也表示,“现在文心大模型4.0比中文的GPT 4更好,因为我们使用了更多的中文数据来训练模型。”

此外,中国有着丰富的AI应用场景。正如李彦宏在大会上所说,“中国AI与西方的最大区别在于应用,中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。”他抱有这样一种观点——技术的进步或改进是由应用场景驱动的。“应用领域的进步可以推动基础模型的创新,也有助于加速从互联网时代到人工智能时代的转变。”

在李彦宏看来,没有构建于基础模型之上的、丰富的AI原生应用生态,大模型一文不值。“如果说大模型是‘树根’,那么大量优质的应用则是大模型壮硕‘树根’所结出的累累硕果。”

过去几年,中国依靠多样化的应用场景以及超大规模市场优势,在社交、移动支付、搜索、电商、外卖、快递等领域孵化一批领先的优质应用,并在产业化的纵深和广度上日益精进。随着AI大模型的接入,将会为产业变革带来更大图景和潜在价值。

李彦宏对此深信不移,他在2024年百度Q1业绩电话会上表示,“随着生成式人工智能时代在中国的到来,文心大模型等基础模型将成为基础设施,融入人们生活的方方面面。我们正在让文心大模型系列变得更加实惠和高效。这将为百度带来更多机遇。”
百度正在“积极推进用文心大模型重构To C和To B业务,利用生成式AI增强用户体验、提升客户效率、提供智能体和应用开发工具、并带来更高效的系列模型。”

To C业务方面,百度已经与三星、荣耀、小米、OPPO、vivo等手机厂商达成合作。比如在三星全新推出的Galaxy S24手机中,深度集成了百度文心大模型的多项能力,不仅可提供端侧赋能的通话、翻译功能,还给用户带来全新的智能摘要、排版等生成AI体验,首创的“即圈即搜”功能更令人惊艳。

而“文心大模型”与荣耀平台级端侧AI大模型“魔法大模型”相结合则满足了用户的更多个性化需求。比如,当用户要求“帮我制定健康计划”时,魔法大模型会分析用户健康信息,自动生成具象化提示词,再调度文心大模型,生成更全面的个人定制健身计划。

如今,文心大模型的合作领域还从手机向PC和电动汽车领域拓展,合作对象包括联想、蔚来汽车等头部品牌。李彦宏表示,向智能设备的拓展,为文心大模型被更大规模用户采用提供了充足机会。

B端,百度充分发挥技术优势,全面升级百度智能云千帆大模型平台,发布系列新模型及开发工具组件,满足企业在大模型产业场景落地中的多样化需求,并已经成功应用在金融、能源、教育等多个产业中。

比如在矿山产业,百度智能云携手山源科技,基于文心大模型,依托百度智能云千帆大模型平台能力共同打造了矿山行业智能应用“电博士及数字调度员”,通过注入供电专业相关知识、经验、规则、规范等,让大模型具备煤矿供电的专业知识和技能,定位于煤矿供电专业的资深贴身助手,实现陪伴式辅助运维。

AI大模型是一个重资源禀赋、高进入门槛的赛道,除了对算法模型的有效性、高质量的数据、算力的支撑能力均有极高要求外,模型的优化迭代亦有赖于资金和人才的持续投入,而大模型的实际落地和应用场景也是其能否持续升级的重要因素。

李彦宏坚信:“在未来五年,或者十年,每个国家都有机会发展自己的AI大模型。我确信生成式人工智能具有真正变个性的力量,它最终会像人类一样聪明,而且进步得很快。当我们朝着这个方向努力的时候,每个人的生活都会得到改善。”