文:任泽平团队

1、 AI应用驱动下一轮洗牌:跨越AI发展冷静期,发展AI向实

人工智能领域正在进入大模型浪潮以来 第一段“冷静期”。

一方面,OpenAI的下一代语言模型Orin遭遇重大瓶颈,效果不及内部预期。其2024年初主推的多模态模型Sora的发布日期也持续推迟。

另一方面,AI行业的“Scaling Law”似乎正在失效,大模型的性能不再随着参数量、数据量、计算资源的增加而产生指数提升。

打开网易新闻 查看精彩图片

AI需要新驱动力,应用驱动将成为第一性原理。进入“冷静期”符合行业发展的规律,就像历史上许多次技术浪潮一样,在度过最初的高期望阶段之后,泡沫不可避免产生。当技术没有达到高期望时,行业会进入一段冷静期,等待新技术和应用变革带来大洗牌。

2、 海外和中国两条路线发展,以AI应用殊途同归

海外AI发展曾经以技术驱动,实现AGI(通用人工智能)等同于实现AI企业的终极商业价值。ChatGPT让产业界看到了以AGI为目标的技术驱动的潜力,但经过两年发展,行业意识到AGI仍然遥远,纯技术驱动还不具备客观条件。海外AI巨头在2024年逐步调整方向,开始以应用开发、产业结合为当前阶段重点。OpenAI转向盈利性商业化运营,谷歌、微软等都开始以To C、企业端、开发者社区合作为聚焦点。

中国AI发展特点是应用驱动。2023年ChatGPT浪潮掀起“百模大战”,积累了早期中国AI市场基础。根据《全球数字经济白皮书》,截止2024年11月,中国的大模型数量高达478个,约占全球总数量的36%。中国市场投入大量资源开发基础大模型,在一定程度上导致AI深层技术发展整体滞后。但另一方面也提高了生成式AI的社会认知和接受度,进而促进个人和企业去关心AI产品与市场的契合度,打下了应用驱动AI发展的“弯道超车”基础。

打开网易新闻 查看精彩图片

原生AI企业是推动行业技术进步和产业化的引擎。2024年11月,沙利文发布《2024年全球AI生态全景概览》,其中原生AI巨头有谷歌、百度、OpenAI三家。通过原生AI企业的技术、产业创新实现“冷静期”跨越有迹可循。比如,谷歌在2017提出了Transformer架构,成为推动预训练模型进化为大模型落地的最关键技术。2023年OpenAI发布ChatGPT,通用大模型首次进入公众视野,唤醒沉寂多年的AI赛道。2024年百度世界大会召开,开创性主张“AI应用向实”,中国AI发展正式进入弯道超车阶段。

3、 重视AI行业的“新三要素”:幻觉消除、开发加速、智能体发展

3.1 大模型欠缺真实感,消除智能幻觉是首要任务

大语言模型(Large Language Model)中的“幻觉”现象指的是模型生成的内容虽然看似合理,但实际存在事实错误;或者AI生成的文字、图片、视频在直觉上不符合人类认知,欠缺真实感。“幻觉”主要有逻辑谬误、捏造事实、数据偏见三类。通常是因为模型的推理能力欠缺,算法框架存在漏洞,数据压缩、数据不一致性等原因导致。

多模态大模型领域兴起,图像、音频、视频类模型也出现幻觉现象。比如,OpenAI的Sora大模型虽然在视频生成领域表现优异,但也存在生成的视频违背物理规律,时空关系错乱等情况。这也是正式版Sora无法上线的主要原因之一。

业内解决“幻觉”问题的方式是采用RAG技术,(Retrieval-Augmented Generation)即检索增强生成,通过结合阶段和增强生成,减少学习数据中的“负样本”,以此来减少大模型的幻觉现象。但这也仅限于在LLM领域。在多模态领域,百度开发了基于图像的iRAG(Image based RAG)技术,将搜索引擎的亿级图片资源与文心基础模型能力进行结合,在强化学习生成下,输出各种真实的图片,整体效果远超传统的“文生图”的原生系统,有效的消除了“AI味”。未来,以iRAG技术为代表多模态RAG将成为业内缓解AI“幻觉”现象的主要方向,为更成熟、更真实的多模态应用发展提供更准确的能力。

打开网易新闻 查看精彩图片

3.2 编程AI应用加速行业走向下个爆发奇点

AI编程应用将加速AI迭代进程,赋予企业和个人更强的开发能力。全球AI企业已经进入“效率时代”,由于软件应用开发的成本高、周期长,算法工程师昂贵且稀缺,通过开发辅助编程AI来提高开发者效率、缩短开发周期成为方向。

一种是企业内部用AI直接辅助开发任务。比如,亚马逊将Amazon Q用于公司内部的软件升级任务,为其节省了相当于“4500 名开发人员一年的工时”,并且还提高了准确性和安全性,降低了基础设施成本。

或是与开发者社区联合开发编程AI助手,提高个人写代码效率。比如,GitHub Copilot由GitHub、OpenAI和微软Azure团队联合推出,可以提供代码建议和自动补全功能,帮助开发者更快地编写代码。

甚至是直接省去人工代码步骤,由AI完成开发全流程2024百度世界大会发布的“秒哒”是里程碑式的开发工具,不同于前两种辅助编程工具,使用秒哒不需要任何代码能力,通过自然语言就能实现软件开发,人人都将拥有程序员的能力。其实现是通过将任务拆解成核心需求、内容结构、工程开发、数据需求四个步骤,再采用多个智能体协同来完成,这也是迄今为止,最复杂的多智能体协作工具。以后随着基础模型能力提升,以及智能体本身的技术能力迭代,秒哒将能完成更复杂的开发诉求,实现系统级开发能力。

百度在AI编程应用上迈出的这一步,不仅消除了未来成为开发者的门槛,更是对AI时代商业模式的一次革新。这意味者实现商业创意或不再需要组织人员架构,智能体就能充当项目经理、设计师、开发工程师,凭借AI工具和创意,个人就能开发产品和创造商业模型。

3.3 智能体是LLM的进化,是可以反思、进化、使用的工具

智能体会变成AI时代内容、信息和服务的新载体,是下一个爆发点。大模型是AI应用的初期形态,具备一定的通用性,但在深度方面欠缺。大模型作为应用发展的下一步是智能体(AI Agent),不但能基于LLM进行任务推理和解决,还具备记忆、规划功能和更强的自我学习能力,并且能使用特定的行业知识完成更复杂、更高质量的任务。

第一类具身智能体(Embodied AI),典型代表有智能驾驶汽车、通用人形机器人。如英伟达CEO黄仁勋所言,具身智能体是AI进入物理世界的超级智能形态。L3以上的高阶智能驾驶是第一步,目前以国内的百度Apollo和美国的特斯拉RoboCab为代表。第二步是通过自动驾驶的大范围应用铺开,积累智驾算法的数据和经验,再构建虚拟环境去训练人形机器人算法,帮助其实现量产落地。比如人形机器人领域领先的特斯拉Optimus,采用的就是其FSD智能驾驶算法。

第二类是平台智能体(Platform AI),为工具、企业、角色、行业、产业等提供AI赋能升级和定制化解决方案。

工具智能体,在个人的工作和兴趣应用场景中拥有强大的创造力和价值,将成为AI界的新质生产力代表。如AI写作、Canva设计助手、logo生成器等等,都是典型的代表。工具智能体的核心在于AI的“自由性”——能通过连接公域(公开数据、搜索引擎内容、社交平台内容)和私域(个人数据、音频、图像、文字)来生成符合用户期望的内容,解锁“创造性”和“独特性”。比如,百度发布的自由画布就是由文心多模态大模型加持的创造力工具,具备输入自由、编辑自由、创作自由三大属性,覆盖从创意绘画、AI写作到专业报告领域等使用场景,帮用户完成从找资料、到编辑、再到生成和分享的全部任务。

打开网易新闻 查看精彩图片

企业类智能体相当于人工智能时代的公司官方AI,具备官网+服务一体的系统化能力。由于传统的企业官网通常信息庞杂、专业术语难懂、视觉观感上易疲劳,检索方式复杂、服务效率较低,已无法满足用户的需求变化。而AI企业智能体则具备了定制化推荐、及时化响应、高效化服务的能力。在汽车零售领域,比亚迪官网是成熟的企业智能体案例,对于不懂术语的用户,智能体能像人类客服一样为用户找出匹配的参数,一键式提供清晰明了的对比,省去手动筛选步骤,给出符合用户期待的建议。

角色类智能体,也就是AI数字人,拥有自己的背景、设定、知识库。可以是基于现实真人、特定职业进行在线服务的AI角色,也可以是虚拟角色。以往的虚拟数字人,大部分存在声音口型不匹配、肢体动作机械、神情呆板等问题。在LLM和多模态的技术加持下,角色智能体能呈现出更高度拟人化的表情、神态、情感。可以充当辅导老师,健康咨询师,网络娱乐主播等,通过与人互动提供知识和价值。实际上,当前的数字人直播在许多场景下已经超过真人直播的转化率,具备可观的商业价值。

行业类智能体,为用户打破信息不对称,提供对应领域的专业服务,在法律、医疗健康、金融、体育、旅行等领域潜力巨大。比如,法律行业的智能体——法行宝就是普通人的专业法律助手,从案件分析、条文引用、赔偿计算、诉讼起草,实现了全流程免费服务。上线半年多以来,百度推出的法行宝为940万多人提供了高效、可信的法律服务。

产业类智能体,为不同产业中、不同分工的公司,提供商业决策中各环节解决方案。比如,餐饮产业的选址和售后服务是两大难题。国内的餐饮龙头百胜集团选择与百度合作,基于大模型能力进行选址评估,提高了上千家门店的选址效率与销售效果。初期的赋能成功后,百胜又对全线业务进行了数字化升级,大模型每天调用量的峰值达到数百万,AI客服的问题解决率提升到了90%。为传统行业转型提供AI升级,还只是产业类智能体的应用探索第一步,未来随着模型学习能力更具深度,数据训练更庞大,产业类智能体甚至有潜力成为公司战略的核心决策者

4、 立足于AI浪潮之中:理想主义、聚焦人才是AI进步的引擎

科技进步的原力是理想主义,前沿的技术浪潮最早都是由少数个人的理想主义来推动的,这一点在AI领域尤其突出。2024年的诺贝尔物理学奖颁给了约翰·霍普菲尔德和杰弗里·辛顿,一方面表彰两位学界先驱对于AI理论研究和产业化的贡献;另一方面,是对两位在深度学习路线受到冷落的30余年,仍然坚定该研究方向的理想主义精神致以敬意。

打开网易新闻 查看精彩图片

30年来,推动美国AI产业发展成型是学术界的辛顿团队和产业界的微软、谷歌团队,将这一成果转换为商业化浪潮的是OpenAI和英伟达。其背后根本是以辛顿、伊利亚、苏莱曼等为代表的学者和以马斯克、奥特曼、黄仁勋为代表的企业家以个人理想主义推动行业进步。

中国的AI产业发展和未来趋势亦是如此,有AI理想主义的企业家是推动行业进步的关键。早在2012年,李彦宏就瞄准人工智能领域,率先意识到AI发展的转折点到来,发起计划收购刚完成AlexNet的辛顿团队。该团队中还包括了后来的“ChatGPT之父”伊利亚·苏茨克维。彼时参与拍卖的还有谷歌、微软、DeepMind,而百度在竞标中一直出价最高,直涨到4400万。尽管因为辛顿的身体条件等原因,最终未能与百度合作,但这场改变人工智能革命的舞台上,中国企业的世界眼光和视角高度让AI学术界感叹。“AI教父”、深度学习发起人之一杨立昆感叹:百度是最早部署商业化深度学习系统的大型公司之一,甚至领先于谷歌和微软。

十年来,李彦宏作为企业家一方面将百度的十年布局聚焦在AI领域,另一方面作为个人也在不断传播他的理想主义,无论是对国家领导、企业家、媒体,还是对朋友、学生、极客,他从不放过任何“布道”AI的机会。在连续8年的“两会”中,李彦宏提出了13份AI相关提案。在坚持十年的“布道”和产业落地中,越来越多的企业也看到了AI技术的价值并开始重视对AI的投入,互联网科技公司转向发展人工智能的信心也更加坚定。

打开网易新闻 查看精彩图片

AI理想主义从理念到落地,根基是聚焦人才培养。2013年,李彦宏组建了成立百度深度学习实验室,担任院长。这是世界上首个以“深度学习”命名的企业级实验室。至此,中国AI领域开始招贤纳士,打稳根基,踏上10年的探索之路。2014年,谷歌猫牵头人吴恩达加入百度深度学习,担任首席科学家,负责百度大脑项目,培养了众多中国AI界的核心技术骨干。2017年,王海峰接棒吴恩达,搭建AIG(AI技术平台体系)后来发展为深度学习技术及应用国家工程研究中心。2023年,王海峰发布百度人才培养星河计划,宣布为社会再培养500万大模型人才的愿景。

十年来,百度不但实现从0到1的AI技术人才骨架逐渐成型,打稳了中国AI发展的人才基本盘,也让人工智能的理想主义队伍不断壮大,为中国AI行业在下一次变革性浪潮中做好了准备。2021年,李彦宏在致股东信中提到:“百度有定力,有耐心。因为我们深知,最前沿的技术浪潮是等不来的,你必须提前10年、20年去布局”。当下看,不仅提前10年布局的百度做到了生态领先,中国AI行业也做到了立足于全球人工智能的大浪潮中。

打开网易新闻 查看精彩图片