小度要成为无处不在的AI伙伴。

“如今的小度,换了一个新的大脑。”

在距离2024年百度Create AI开发者大会一周前的一次交流中,小度CEO李莹对36氪如此形容小度的蜕变。

而在大会开场,小度为这个全新的“大脑”留下悬念。百度集团创始人、董事长兼CEO李彦宏,与小度添添AI平板机器人进行了一段互动:

“帮我安排一下日程,今天活动结束后,我会和张总一起用晚餐,之后在酒店有个管理层的会议,大概需要1个半小时,希望10点之前可以结束。明早我准备晨跑,看看天气如何,然后上午8点有个早会,请帮我安排好日程。”

这段普通的指令暗藏玄机,既有简单的新闻问询,也有复杂的日程安排。此前的小度,大概率会以“抱歉”遗憾收尾。但在会上,小度给出了近乎完美的答案:

  • 您与张总晚餐安排在18:00-19:30,结束后,您将在20:00参加管理层会议,21:30左右结束;
  • 明早6点闹钟将提醒您起床去晨跑,跑步时长控制在1个小时以内,确保明早8点早会不迟到;
  • 明早天气晴朗,气温25度,建议您穿短袖外出,做好防晒。

打开网易新闻 查看精彩图片

这份蜕变背后的最大变量,在于一颗基于百度文心大模型的“最强大脑”:DuerOS X。

在AI算力从云端逐渐转移到终端应用、大模型从软件应用逐渐渗透至硬件产品,已经连接超4600万家庭的“国民AI伙伴”小度,自然而然的站在了AI技术变革的浪潮之巅。

“小度AI智能助手是百度文心大模型的重要且规模庞大的落地应用,Duer OS X作为全新的AI native OS,完成全面‘换脑’,引领AI原生应用迈向全新的高度,它将为我们带来前所未有的智能体验,开启全新的智能生活篇章。”李莹谈到。

纵观小度换上DuerOS X这颗“新脑”的过程,就会发现,这是一串被百度冠以“最好”形容词的“AI+硬件产品”的打磨链条:

支持复杂日程安排、高语境交流等场景的,是性能最好的大模型文心4.0;负责响应用户不同问题和需求的,是国内最大的智能体平台百度“灵境矩阵”上的2000多个Agent;用于平衡小度解决问题精确度和推理成本的技术,则是最前沿的MoE(混合专家模型)架构;决定“大脑”聪慧程度的训练数据,则来自国内智能音响领域最完整的数据库——小度近十年来积累的高质交互数据。

新脑”换来的,是更机灵、懂你的小度,也是百度全新软硬一体时代的开启。

01 Connecting the dots

01 Connecting the dots

小度蜕变的开始,可以回溯到近十年前——在2015年9月的百度世界大会上,小度的前身,搭载着DuerOS的对话式人工智能秘书“度秘”完成了首秀。

彼时的李莹,负责百度知识图谱的研发,也为度秘产品提供支撑。她对36氪形容,当时的搜索,遵循的Top One是“一条结果,满足一个问题”。这条Top One原则,让度秘的“大脑”,更贴近于传统搜索,用户问一个问题,度秘给出一个准确的回答。

在“人工智障”戏称流行的年代,DuerOS这颗“大脑”的表现无疑是惊艳的。

DuerOS最早被大家熟知,是在2017年的“百度AI开发者大会”正式发布的对话式操作系统,利用语音技术、自然语言处理技术、搜索技术等,打造了听清、听懂、满足用户需求的人工智能对话系统。

然而,当时间来到2023年,“一条结果,满足一个问题”,已经无法再让用户满足。

“简单来说,如果小度还是这个水平,就不够聪明了。”李莹对36氪坦言。

若想设置一个复杂的日程,比如“8:00 am完成任务1,继续完成任务2,且任务2必须在10:00 am前完成”,小度的回答是一句令人遗憾的“抱歉”;再比如,“在搜索引擎原来搜不了的东西,在小度上也一样回答不了”。

但相对地,大模型的发展对小度等智能硬件而言,又是最好的机遇。高通CEO Cristiano Amon曾总结,计算机的发展史,就是算力从超算等大型设备一步步转移至终端设备上的过程。素有“消费电子春晚”之称的CES(国际消费电子产品展),2024年的主题则是“AI for Everything”。

主打家庭场景的小度,站在了离用户情感空间最近的位置。

但仅仅是站在风口中,对小度而言还远远不够。为小度换上一个AI原生的“新脑”——DuerOS X,是小度在新战场的新武器。

2005年,苹果创始人史蒂夫·乔布斯在斯坦福大学的毕业典礼上,曾将自己当下的成就,比作“Connecting the dots”,即过去点滴的积累。

若是细数DuerOS X诞生的必要条件,就可以发现,小度为此刻的蜕变串联了百度、小度将近10年的dots。

“小度从来不是一家单纯的硬件公司。”小度曾在不同场合一再强调智能硬件,不仅仅是硬件的战场,而也是一场“大脑”——软件的比拼。

对“大脑”的强调和持续打磨,让小度“换脑”显得水到渠成。从DuerOS跨越到DuerOS X,最大的变量是百度的通用大模型基座“文心”——这又是一个跨度超过十年、有关百度立身的根本和“让所有人能使用最先进的生产力工具”朴素愿景的故事。

打开网易新闻 查看精彩图片

李莹 百度集团副总裁、小度科技CEO

02 换脑

02 换脑

大模型应该怎么和硬件结合?硬件的形态应该怎么做?能落地的场景有哪些?

小度的同事们反复研究了CES上的智能硬件产品,得出了一个有些令人沮丧的结论:有意思的产品很多,但技术还没跨越可商业化应用的鸿沟。

“但大模型给人的惊喜是,它每天都在进步,能力的边界在扩展,成本也在持续优化。”李莹说道。

但给小度“换脑”,并不仅仅是接入文心大模型这么简单,而是从数据工程,到技术框架,再到产品应用的全面重造和适配。

“海峰老师(百度集团CTO,文心大模型负责人)他们已经从金矿里面炼出金子,”李莹对36氪打了个比方,“我们要做的是把金子变成戒指或者耳环。”

小度“换脑”的第一件事,就是技术框架的重构。这需要团队有很强的工程及算法能力,让系统的适配性、鲁棒性更强,系统效率更高。小度从第一天起就是软硬一体,工程能力很强,可以快速做重构。

另外,就是要基于小度的场景,做不同的数据工程工作。比如,为了给小度创造不同的AI伙伴人设,要去做大量和精细的数据工程,比如数据收集/标注、训练和调优,还要为每个人设去设计独特的Prompt(提示词),以帮助模型更好地理解和塑造人设。

要让小度更像人,意味着系统的交互方式也要围绕着“像人交流一样”去打造。不少软硬件和操作系统接入大模型,都仅仅是在过去的键鼠或者触屏的交互方式上做叠加。“小度一开始就是针对多模态交互设计的。”李莹介绍。从芯片、摄像头,细到麦克风阵列,小度为大模型驱动的多模态交互,做了不少调试。面对如今的小度,用户用语音、文字,甚至是手势和表情,就能非常自然地表达自己的需求。

在一般场景下,文心大模型已经足够好用。但面对用户需求复杂的家庭场景,小度发现:通用大模型解决问题的精准度和成本都面临现实问题。

小度的解法是,采用模型路由架构取长补短。所谓的模型路由,可以简单理解成用一个模型团队,分工处理复杂任务,团队中的每个模型,就是术业专攻的“专家”。

采用模型路由架构,对花了一年多时间建模型生态的百度而言,有着得天独厚的优势。“现在文心大模型的不同尺寸和特点的模型,小度全在用。”李莹告诉36氪,采用模型路由结构,既能在小度上充分利用不同模型的优势,还能根据任务的难易程度合理调度模型资源,控制成本,比如仅仅让小度设置一个简单的定时提醒,就不需要用到大模型旗舰版。

今天,给小度“换脑”的大工程,有了DuerOS X这份答卷。

小度将DuerOS X定义为“全球首个AI原生操作系统”。在李莹看来,“AI原生”不仅意味着DuerOS X的性能变得更加强大,还意味着操作系统的角色发生了改变:

市面上多数智能硬件产品的操作系统,充当的往往是软件和硬件之间的中间件,解决的是资源分配和任务调度问题,并不理解用户。但得益于大模型的理解、生成、逻辑、记忆等能力,AI原生操作系统最重要的角色,则是担任端到端地解决用户意图和任务之间的中间件。

那么用户会如何感知到小度换脑后的进化呢?

如果用一句话总结DuerOS X的用户体验:就是它更聪明、能干、懂你,以及能更好地提供陪伴。换言之,相比过去“有用”的 AI 助手,现在的小度更“有灵魂”、更像真人了。

“就好比以前的小度负责保质保量地完成任务,现在的小度还会预测用户的意图、主动发起追问,不会把天聊死了。”李莹告诉36氪。不像以前只能一对一的指令式问答,而是更自然的多轮对话,是用户可以从“换脑”后的小度身上,得到的最为直观的感受。

小度的“聪明”还体现在中国人讲求的“耳聪目明”,即多模态的感知技术的增强。一个典型的功能是绘画导师,即使没有专业的绘画功底的用户也不用担心,只要在屏幕上简单地勾出轮廓,小度就能直接将简笔画“精装”,生成精致的绘画作品。用户还可以通过简单的文字描述,来生成一个属于自己的故事绘本。

更“像真人”还体现在小度对用户的个性化记忆能力。比如用户对小度说过,对小龙虾过敏,那么当小度为用户推荐宵夜的时候,会特别提醒“别吃小龙虾,会过敏”。这种能力有赖于小度的个性化长短记忆的存储、提取、理解能力的提升,让小度接得住用户的每一次“考古提问”。

另一个有趣的体验,则是小度不仅有了“脸”,还长出了“躯干”。基于大模型驱动的数字人技术,小度可以在屏幕上生成个性化的数字人形象。无论是作为孩子的可爱伙伴,还是老人们的陪聊对象,通过小度的屏幕,都成了可被感知的真切存在。在今年的春节期间,小度上线了家庭AI年宠——“度龙龙”。它知道很多年俗知识文化,可爱的样子深受小朋友们喜爱,小朋友们的聊天对话的次数和时长,明显增加,在陪聊的同时,长了知识,可谓是寓教于乐。

而在不那么明显的地方,DuerOS X也下足了功夫。“小度现在不是一个‘人’在为你服务,而是背后站了一群‘人’。 ”李莹表示。百度2023年9月推出的文心智能体(Agent)平台,汇聚了2000多个功能各异的AI Agent,如医生、老师、律师、国学大师、星座达人、健身教练等等智能体。接入文心智能体生态,意味着小度可以根据不同人群多样化的需求,调度最合适的Agent来完成任务。比如它可以是用户的AI健身顾问,大到提供健身规划,小到问一下这个水果多少热量、是否适合减肥期间食用。

所谓的“AI原生”,也体现在DuerOS X背靠的,是百度的AI应用生态。这就意味着,小度的“新脑”将会持续地迭代,能力的边界也将不断扩展。

在过去,软硬件适配是个成本高昂的重工程,比如,而基于DuerOS的开发,因为大模型变得更简单了,AI可以省去重复适配流程,无缝植入到各种智能硬件中,内容生态也可以通过Agent的接入轻松适配——未来,小度的“大脑”,将拥有更繁荣的应用、内容和服务生态。

打开网易新闻 查看精彩图片

“‘换脑’没有终点,这必然是个继续演进的过程。”李莹表示,“质变已经完成了,接下来就是根据用户反馈持续打磨。而新的“大脑”会根据用户返回数据越多变得效果越好,越聪明!”

03 做一款无处不在的AI伙伴

03 做一款无处不在的AI伙伴

2022年底,一名小度用户突然收到了一条来自百度的短信:“紧急!您的家人正在用‘小度急救助手’求救!”

通过小度App的远程视频功能,这名用户发现,自己的姥爷并没有像往常一样早起。他第一时间告知了离姥爷家最近的舅舅,最后成功救治了感染新冠和脑供血不足的姥爷。

这个故事为李莹带来了很大的触动。“我一直觉得AI能够让人们的生活和工作效率更高,让人们的生活也更便捷。”李莹告诉36氪,“我相信技术要从科学突破再往前迈一步,去驱动产品变革。”

小度CEO,这是这位在百度20年的老将的新身份。和小度一起站在AI风口的中心,她仍然怀揣着满腔热忱:“之前我主要聚焦在互联网软件领域,现在,我要去进一步探索软硬一体化的产品,包括它的设计理念、产品逻辑,以及智能硬件消费品的玩法等等,都为我打开了新的兴趣领域。”

角色是新的,但“技术驱动产品变革”的朴素实用主义,在李莹身上一直没有变过。2018年,李莹正式从研发的后台走到了产品的前台,担任百度地图事业部总经理。两年后,李莹被任命为百度集团首席信息官,着手发展AI时代的智能工作平台“如流”。

百度地图解决的是出行效率,百度如流提高的则是人们的工作效率,在李莹看来,这些业务本质上都是用技术驱动产品变革,用AI的能力,让产品服务于用户。她告诉36氪:“从这个角度而言,小度和我过去做的事情是一脉相承的。”

后来,2023年10月,当李莹接任小度CEO时,她表达了自己的期待:“AI是⼩度的基因和底⾊,它不是⼀个单纯的硬件消费品,这是它与其他‘卖货’公司最⼤的不同。⼩度本质上是AI的应⽤载体,⼤模型为⼩度带来千载难逢的机遇。”

理念一脉相承,但AI新时代的硬仗还是要打。在新一轮的大模型技术浪潮中,李莹和小度得出的答案是:让小度成为无处不在的AI伙伴。

打开网易新闻 查看精彩图片

DuerOS X这颗新“大脑”,已经生长出了添添AI平板机器人,还在接入小度智能音箱和智能屏、添添闺蜜机、小度健身镜、智能学习平板、小度全屋智能,成为用户的AI闺蜜、AI教练、AI家教、AI管家,以及角色更百变的AI伙伴。

“⼩度的产品定位从诞⽣起就没有变,我们的愿景始终是让AI 助⼿⾛进千家万户,现在⼤模型技术让这个愿景更近了。”李莹总结。