作 者:微澜
来 源:正和岛(ID:zhenghedao)
一、AI大战还在加速
当下,对于人工智能领域我们需要愈发重视起来。因为这场人工智能“大战”还在持续加速演化。
这背后可以从两个维度来看。
从全球视角来看,为了尽快训练出下一代大模型,全球科技巨头代表微软、谷歌、OpenAI以及马斯克的人工智能公司xAI都在积极构建10万卡计算集群。作为科技竞争的桥头堡,AI已经成为了战略上的必争之地。
回到行业视角来看,会发现以大模型为代表的AI竞争也来到一个全新的阶段——从表面数据的比拼深入到更实践层面的竞争。
过去我们判断一个大模型的优秀程度可能更多是依据参数量、算力、文本生成数量以及模型调用价格等一些能够量化的维度,但现在对于一个大模型来说,它能否深入到行业、产业中去真正创造价值才是重中之重。
好比NBA选球员,你选了5个从身体数据来看都达到全明星标准的球员,但不代表这支球队就一定能拿下总冠军,在赛场上除了看球员的身体数据,更考验团队的战术能力、默契程度以及意志力比拼等综合指标。
那么面对“AI大战”持续加速的趋势,对于我们多数人而言,又有哪些思考价值和新的可能呢?
11月12日,百度世界2024大会在上海举办,百度创始人李彦宏更是在大会上发表了一场重磅演讲,让我们看到了AI时代的许多新可能。
二、许多新可能在涌现
那么,在百度世界2024这场大会上,我们能看到哪些新可能呢?
我们可以先看下李彦宏在演讲中向我们展示的3项重点产品和技术:
1.检索增强的文生图技术iRAG
“如果你要问我,过去这24个月,对行业而言最大的变化是什么?我的回答一定是,大模型基本消除了幻觉。”
在演讲开场,李彦宏分享了当下大模型技术的发展情况,“今天文字层面的RAG已经做得很好了,但是图像等多模态内容和RAG的结合还不够。”
于是,针对这种情况,百度开发了一项颠覆性的技术iRAG,其是由百度自研的检索增强的文生图技术,通过将百度搜索的亿级图片资源和强大的基础模型能力相结合,从而生成各种超真实的图片。
iRAG技术具备无幻觉、超真实、没成本等特点。如何理解这几点?
以北京天坛的照片为例,真正的天坛是3层,但是某开源模型却生成了4层。这是文生图领域存在的典型幻觉现象,这种现象非常普遍,在很大程度上限制了多模态大模型的规模化应用。
而iRAG技术则极大地解决了这个问题,比如我们生成“一张东方明珠在深山里的图”,如下图所示:
如果不标注这张图片为AI作图,可能很多人会直接认为这张图片出自某位摄影师,你再去对照这张图片的细节,你拿着这张图片去和现实的东方明珠比较,也很难找出两者的差异来。
这样的好处是什么?
过去大家对于AIGC内容更多还是抱着一种好玩、新奇的态度来尝试,但等这股新鲜劲过去后,可能这个内容对实际工作更多还是一个“鸡肋”的效果,但现在它将能够真正意义上帮助用户大幅度降低内容创作成本。
拿一些汽车品牌来说,过去汽车品牌想要在沙漠、森林等户外场地拍摄一组宣传海报可能动辄需要上十万,甚至大几十万,但现在是真可以通过iRAG技术直接生成,而且是能一口气生成多个主题海报。再经过后期调整优化,创作成本接近于0。
2.无代码工具秒哒
如果说iRAG技术还只是在过去文生图技术基础上的一个进化,那么无代码工具秒哒则完全是一个全新的事物。
作为一款不需要写代码就能实现任意想法的软件,秒哒涵盖无代码编程、多智能体协作以及多工具调用等特点。
什么概念呢?
相当于有了秒哒,你就可以通过自然语言交互,完成一整套应用系统的搭建,并且应用开发的复杂度也将随着百度技术的提升而不断降低。
秒哒生成萝卜快跑新技术发布会活动邀请函
再进一步简化成“人话”就是,只要你懂中文,再看一些这个产品入门教程,你就可以像那些专业的程序员一样去开发AI应用了。
3.智能体
至于智能体,你可以将其理解为AI时代应用的最主流形态,百度将其分为公司类智能体、角色智能体、工具类智能体以及行业智能体这4大类。
拿行业智能体来说,百度推出了一款法律行业的智能体——法行宝,仅上线半年多时间就为近千万人提供了法律咨询服务。
法行宝帮你写一封起诉状
俗话说得好,人生有必不可缺的三位朋友,分别是律师、医生和老师,但对大多数人来说,这三位朋友能够都拥有是一个很高的门槛。而在智能体的帮助下,人人都能免费拥有这三位“随时提供帮助的朋友”。
如果将App比作传统纸媒,那么智能体就像PC时代的网站和移动互联网时代的自媒体,在AI原生时代,智能体将成为内容、服务和信息的新载体。
“智能体最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂,非常强大的应用。我认为,将来会有数以百万量级的智能体出现,形成庞大的智能体生态。”此前,李彦宏就谈到1对智能体的看法,“作为AI应用的最主流形态,智能体即将迎来它的爆发点。”
而透过这些产品和技术并结合着李彦宏的演讲再深入去看,你就能意识到为了迎接正加速到来的AI时代,百度进行了三重“重构”。
三、AI时代三重重构,未来已见雏形?
1.AI时代的内容重构
说内容的重构,不如说是内容获取和创作的进化,因为内容重构从AIGC(人工智能生成内容)诞生时就已经在潜移默化地进行了。
ChatGPT的出现则是一个节点,让AIGC技术真正被大众所了解,但从了解到普遍应用还有一个过程,在这个过程中将诞生许多我们难以预测的可能性。
就如同PC互联网到移动互联网的过程,就涌现了大量的科技公司,比如美团、滴滴、抖音等。
这里以百度文库作为AI时代的一个更具体案例来讲,很多人可能想不到,包括笔者也是最近才了解到,百度文库已经从过去的文档平台进化为了一个“一站式AI内容获取和创作平台”,并且将应用场景拓展到了学习办公、家庭教育、娱乐消费等多个领域。
除了提供14亿权威专业的文档之外,百度文库还依托于百度文心大模型,推出了智能PPT、智能写作、研究报告、智能画本、AI全网搜及全场景指令编辑等上百项文本类、跨模态类和多模态类AI能力。
也就是说,百度文库相当于一个内容创造的“AI百宝箱”。
这里笔者再拿百度文库的自由画布能力来说,笔者在其中进行了一个画本制作的尝试,就发现其智能生成的画本内容已经拥有了较为连贯的叙事能力、基本的鉴赏审美性以及传递正向的价值观,可以供幼儿进行启蒙教育。
什么概念?过去一个10余人的团队,制作一个画本可能需要一两个礼拜的时间,但现在你一个人只要想法足够,通过智能画本,一天时间就能生成数个同样量级的画本。
正如李彦宏在演讲上所讲:“我们将迎来一个前所未有的只靠想法就能赚钱的时代,只要你有想法,你就可以‘心想事成’。”
而面对这样一个“心想事成”的可能性的未来,我们要做的就是积极去拥抱、去尝试、去开拓。
2.AI时代的工具重构
百度在工具重构方面最显而易见的动作便是无代码产品秒哒了。
在经济学领域,有个重要名词叫作“通用目的技术”,指可以融入无数领域,为更多发明创造带来推动作用的技术。
事实上,人类社会的长期经济增长本质上都是由“通用目的技术”创造的,比如带来第一次工业革命的“蒸汽机”,又或是第三次信息技术革命创造的“互联网时代”。
某种程度上,百度的秒哒也相当于AI时代的通用目的技术,其集成了文心一言大模型和大量的强大且方便协作的智能体和工具,而这些都将有效降低AI时代应用开发的技术门槛,并催生出大量的开发者和AI时代的应用。
它打破了特定群体的“技术垄断”,让每个人都可以利用最前沿的AI技术,从而提高了生产的平均效率。
正如李彦宏在演讲中分享的:“我们不是要推出一个‘超级应用’,而是要不断地帮助更多的人、更多的企业打造出数以百万‘超级有用’的应用(智能体)。”
并且藏在工具重构背后的思维重构,更值得关注。
3.AI时代的思维重构
当AI出现时,几乎所有人都在问的一个问题是,AI时代的杀手级应用(Killer App)是什么?又将在何时出现?
但是有没有一种可能,即在AI时代不存在杀手级应用这一思维定式。
这里引用高通总裁兼CEO安蒙此前的一段讲话:
“AI变革的是人与计算机的交互方式,让计算机可以理解人的所见所闻、所思所想,所以未来会出现成千上万的应用,而所有的应用都可以是王牌应用。”
举个例子,每个人手机上都有购物App,然后购买一件商品可能会在不同购物平台挑来挑去,整个过程需要频繁切换,但是未来在AI的帮助下,用户与购物App的交互完全可以用自然语言来完成,比如“按照我过往习惯帮我列一个双十一购物清单,并保证优惠力度最大”,用户只需要用语言表达,AI就会自动完成操作。
这背后,正是“AI first”带来的体验,笔者再详细讲一下这个过程:
首先AI要理解人的输入/输出,包括语言、触摸、空间环境等,所有这些都会进入AI Agent(智能体);
然后Agent理解用户的个性化数据,包括工作、娱乐、健康等,再通过一系列多模态模型,最终所有的体验都是个性化且人性化的体验。这种体验,就打破了传统App的孤岛,App之间将会自由联动。
而这将是思维上的巨变,这种变化将重构所有架构,包括操作系统、应用商店、算力平台等。用户可以有很多选择,选择更喜欢的智能体,选择更适合自己的工作生产力、娱乐方式和数字生活等。
从具体的内容生产模式重构,到生产工具的重构,再到深层思维的重构,某种意义上说,在这场大会上百度已经向我们展示了AI时代的未来雏形。
四、想要照亮千行万业的AI之路,百度凭什么?
“百度希望与所有创业者一起,共建繁荣的AI原生应用和智能体生态,帮助创业者更早找到PMF,做出AI时代的超级应用。”
在今年的另一场演讲中,李彦宏分享了这句话。
喊出这样一句话,需要勇气更需要底气,显然百度二者都兼备。
在百度世界2024大会上,百度公布了一组数据,截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,日均调用量增长超过近30倍。
而在这组数据背后,更需要注意的是百度在AI领域的沉淀和积累,有媒体用了两个数字来形容——12年AI布局,投入近1700亿元:
“10年前,我们意识到,人工智能技术智能已经成熟到可以解决搜索问题,以及搜索以外的很多问题,我们开始大举投入人工智能技术的研发,期待用技术让复杂的世界更简单。”2021年李彦宏在《致股东信》中讲到。
早在2012年,百度就已开始涉足AI领域,成为最早投入到AI领域的企业。
当时,百度一位高管向李彦宏演示了深度学习技术对于搜索的改进。李彦宏因此写了一封邮件,鼓励全百度产品经理了解AI技术最新趋势。
而在那一年,李彦宏更是积极带领百度进入人工智能领域,计划收购当时全球最顶尖的GeoffHinton团队。在竞标中百度一直出价最高,直涨到4400万。但Geoff Hinton由于种种原因最终未能与百度成功合作。(在《》中详细回顾了这一事件)
这是一个遗憾,但这个遗憾并未就此阻挡百度和李彦宏的进军AI的脚步。2013年1月,百度CEO李彦宏宣布成立深度学习研究院。
2014年,吴恩达加入百度担任研究院首席科学家。此后,百度也马不停蹄地在AI领域不断拓展深耕,10多年的时间里,百度在AI领域投入超1700亿。
“过去10年,我们打基础、建生态,在人工智能大潮奔涌而来的今天,百度成为了领先的AI生态型公司。”2021年李彦宏曾分享到,“百度有定力,有耐心。因为我们深知,最前沿的技术浪潮是等不来的,你必须提前10年、20年去布局。”
种一棵树最好的时间是在十年前:
于是在过去十余年的时间里,百度智能云千帆大模型平台帮助客户精调了3.3万个模型、开发了77万个企业应用;
于是,百度智能云拥有了中国最大的大模型产业落地规模,超过六成的的央国企和大量的民营企业,都在联合百度智能云进行AI创新。
来到当下,百度当年的大量构想,正在一一实现,其背后都是有实实在在的业务支撑的,而在大模型落地应用层面,百度也可以说是领行业之先的。
在2021年的《致股东信》,李彦宏曾写过这么一段话:
“过去的21年中,每当百度徘徊在十字路口,我都会问自己,什么能够让你真正制胜未来?
我认为就是两方面:一是你信仰什么(What do youreally believein);一是你有多大的决心(your determination)。
从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。我们也有决心,有耐心。我们熬得过万丈孤独,藏得下星辰大海……我们始终相信,科技为更好。
我们相信,技术的开放共享,让再微小的企业,都可以享受技术的红利,在创新面前机会平等;让再弱小的个人,都可以分享创新的果实,实现结果平等。
我们相信创新和创造,我们相信良知、善行,将让这个世界走向阳光地带,走向星辰大海。”
这段话也让我想起了英国哲学家培根的一句话:
“在所有的能为人类造福的财富中,我发觉,再没有什么能比改善人类生活的新技术、新贡献和新发明更加伟大的了。”
纵观世界上的一流企业,它们都有一条发展共识,即企业需要有推动整个产业跃升、改变世界的使命感,同时企业需要有造福社会、造福于人的意识。
而中国的未来也恰恰在于拥有一批这样一流的企业。
祝福每一家用商业能量为社会注入更多美好,用科技力量去改变世界的中国企业。
也祝福百度,能够在AI时代上始终践行自己的理念,照亮中国千行万业的AI之路。
排版| 小元| 微澜主编| 孙允广
热门跟贴