11月12日,在上海举办的百度世界2024大会上,李彦宏发布了检索增强的文生图技术(iRAG)和运用智能体协作实现的无代码工具“秒哒”等重要产品。
截至11月初,百度文心大模型的日均调用量已超过15亿次,相较于5月的2亿次增长了7.5倍,与一年前首次披露的5000万次相比,增长了约30倍。
幻觉问题是大模型广泛应用的主要限制之一,而检索增强(RAG)技术是解决这一问题的关键。目前,文字层面的RAG技术已经相当成熟,但在图像等多模态方面,RAG技术的结合还不够充分,尤其是在生成特定地点、物品和人物的图像时,常常会出现错误匹配的问题。
百度文心iRAG技术旨在解决大模型在图像生成方面的幻觉问题,从而提高其实用性。iRAG结合百度搜索的亿级图片资源和强大的基础模型能力,可以生成超真实的图片,去除机器味。李彦宏展示了一幅“大众揽巡汽车飞跃长城”和一幅“爱因斯坦环游世界”图片,作为例子。
在影视作品、漫画、绘本、海报制作等应用场景中,文心iRAG的商业价值体现在无幻觉、超真实、零成本和即时获取等方面,真正实现大幅降低创作成本的愿景。
“秒哒”则旨在使每个人都能够拥有编程能力,进而创造数百万“超级有用”的应用。它是以智能体为基础的一个示例应用,具备无代码编程、多智能体协作和多工具调用三大特性,使用自然语言即可搭建一整套系统,这标志着一个“只靠想法就能赚钱的时代”的开启。
多智能体协作是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;通过文心大模型可调用网页检索、iRAG、地图API等各类型工具。
演讲现场展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥“小组长、策划、小编、程序员和质检员”五个智能体互相协作,完成报名系统的开发。
李彦宏认为智能体将成为AI应用的主流形态,并即将达到爆发点。他详细阐述了公司、角色、工具和行业四大类智能体,并类比PC时代的网站和移动时代的自媒体账号,强调智能体更接近人类,更智能,成为AI原生时代内容、信息和服务的新载体。
例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,允许用户在类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。法律智能体“法行宝”已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。
目前,文心智能体平台已吸引了15万家企业和80万名开发者。李彦宏展示了文心智能体平台的TOP100智能体和TOP100产业应用,称公司智能体可以根据顾客需求推荐相应产品,并在服务方面更直接、快速地响应需求,大幅提升互动营销的效率。比亚迪官方智能体上线后,销售转化率提升了119%,联想AIPC智能体的9月互动率提升了89%。
想跟作者进一步讨论本文,欢迎您加入航通社的读者交流群!请添加入群小助理个人号,微信搜索:hangtongshe ,附言写“航通社读者进群”。
热门跟贴