打开网易新闻 查看精彩图片

来源|Tech星球

|陈桥辉

AI已成为各大科技巨头角逐的关键赛道,而蚂蚁集团在AI领域的密集布局,愈发引人注目。

2024年12月30日,支付宝宣布推出新一代AI视觉搜索产品“探一下”,基于自研的多模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。

蚂蚁的AI布局,早就有迹可循,板块也愈发清晰。过去两年,蚂蚁自建了万卡异构算力集群,自研了百灵大语言模型和多模态大模型;应用层面,推出三大AI管家,让AI“有手有脚”能办事,开拓全新的办事型AI形态;生态方面,以支付宝商业生态为主阵地,发布智能体开发平台“百宝箱”,为千万商家打造AI“掘金铲”。

久未露面的马云,也公开表达了AI之于蚂蚁的动能。他在蚂蚁20周年晚会上表示,“未来的20年,AI时代所带来的巨大的变革,会超出所有人的想象”。

毫无疑问,蚂蚁正在尝试以支付宝为核心,用AI加速科技驱动力。未来的蚂蚁,AI或将会成为其重要的底色,甚至是打造新蚂蚁的推进器。

借AI“探”万象

借AI“探”万象

相比于大厂热衷布局的AI社交、AI视频、AI音乐等热门赛道不同,此次支付宝通过推出“探一下”,则切入了一条全新的生成式AI视觉搜索赛道。

Tech星球体验发现,“探一下”是基于蚂蚁百灵多模态大模型技术的AI产品,相比于传统的视觉识别产品,“探一下”可以提供更快速、有用、趣味的生成式搜索服务。

用户在支付宝首页点击 “扫一扫” 后往左划,即可找到 “探一下”的入口,在支小宝App也能快速访问。进入“探一下”的主界面后,只需定格摄像头所捕捉的画面,系统便会开始分析并生成结果。

打开网易新闻 查看精彩图片

图注:支付宝“扫码”旁边就是“探一下”。

不同于以往的扫五福等玩法,运用的都只是图片识别技术。支付宝上线的“探一下”,除了融合原有的AR扫之外,还有三个特色核心功能——探知识、探灵感、探文本,兼具实用性和趣味性。

“探知识”是对内容进行识别,在捕捉画面主体后主动生成识别结果,并基于此进行发散性的信息智能推荐。

探知识的使用场景并不少,在生活、旅行、学习、购物等场景中,都有着很大需求。譬如,用户在购买手机时,不仅可以通过 “探知识” 直观地看到手机的配置信息、设计灵感等知识,还可以通过其附带的“探商品”入口,跳转至商品界面,完成从了解手机到购买手机的链路。

打开网易新闻 查看精彩图片

“探文本”也是基础的通用功能,可用于文本提取和翻译。譬如,对于跨境游客、跨境商家和海淘买家大有作用,遇到外文菜单或商品详情页,就可以快速提取关键信息并翻译。

除此之外,“探一下”还有“探灵感”的功能,Tech星球发现,在小红书内,“探灵感”成为了不少用户讨论最多的一个功能。

一位用户直言,“探灵感”让内容有了生命。从AI的视角看,这种生命感,源自“探灵感”让内容被AI赋予了特别的视角滤镜。譬如,可用幽默或治愈的视角,对静态图片进行趣味解读,让你在网上晒图再也不愁写啥文案。

打开网易新闻 查看精彩图片

总体上,“探一下”是一款具有创新性和实用性的生成式AI视觉搜索产品。不过,从目前的使用体验来看,也还有待完善的地方,例如,会受到光线、角度、距离等实际场景因素的影响,导致识别结果不准确或出现错误。

从“搜”到“探”,引领下一代AI视觉搜索

从“搜”到“探”,引领下一代AI视觉搜索

搜索诞生20年,一直致力于帮助用户更平等地获取信息。

传统搜索一直在进化,信息输入方式从手动打字到语音唤醒、图片识别,但始终未能焕新呈现结果。在Make 2024钉钉生态大会上,钉钉COO傅徐军在接受媒体采访时还谈及了传统搜索引擎难用的更多原因。他表示,传统的搜索检索到的大量信息是碎片化、离散化、非结构化的。

这背后折射出的是传统搜索模式基于关键词匹配的低效,较难精准理解用户的真实意图,仅仅是机械罗列可能相关的内容。而用户得到想要的内容,还需要在搜索到的内容中进行二次甚至多次检索。

生成式AI技术让搜索有了革新的可能。不少企业正在尝试革新搜索,比如搜索鼻祖Google旗下的视觉搜索产品Google Lens。

Google Lens近年来不断拓展功能边界,比如增加视频搜索与语音输入等形式,然而其核心依然是围绕传统搜索以“搜”为主的理念的修补,比如Google Lens生成的内容必须链接到Google自己的搜索结果,但是Google自己的结果跟内容生态并不是为视觉入口去设计的,很多还是基于文本的一个入口;国内的识别类AI则专注于花草等识别,却也只是在细分领域深耕细作,未能投入大规模应用。

在支付宝探一下业务负责人蔡伟看来:未来的搜索有两大发展趋势,第一个趋势就是从搜索到生成;第二个趋势是从文本主导的交互走向多模态交互。

技术极客们的终极目标,正是希望用户一次就可以得到满意的答案和服务。这是探一下和其他搜索工具的核心区别。

探一下通过视觉大模型的识别和思考后,基于生成式AI技术给出系统性的答案,而不是碎片化的信息。这不仅是简单的技术升级,实际上背后是一种全新的交互逻辑。

以潮玩识别为例,传统搜索可能只是敷衍地给出基本信息,“扫” 模式也仅是略知一二,而 “探一下” 则将被动搜索转变为智能推荐,能深挖其收藏价值、市场动态及同系列产品的前世今生,这种深度挖掘能力源于其先进的算法架构和海量数据的精准训练,使其在知识理解与关联拓展上更进一步。

同时,“探灵感” 像是创意的源泉,为图片量身定制趣味盎然的文案,开启用户与 AI 携手创作的大门,这也是以“搜”为主导的搜索时代无法完成的功能,因为它能从有用信息迈向有趣内容 ,给用户独特的情绪价值。

搜索引擎的核心始终是如何正确理解并回答用户的提问。在生成式AI技术的加持下,“探一下” 正探索一种全新的视觉交互方式和入口。它有眼睛能探索万物,也像人脑一样思考,想要一步到位给出用户最全的知识图谱,让用户的搜索体验得以变革性提升。

积厚成势,AI焕新蚂蚁

积厚成势,AI焕新蚂蚁

20年前,中国开通国际64K Internet信道,标志着中国正式全功能接入了国际互联网,并且诞生了一批传奇性互联网企业。如今,随着技术红利见顶,互联网市场饱和,对于蚂蚁这样的互联网公司而言,急需探索新的技术点、挖掘新的盈利点,寻求破局关键。

AI技术,或许能成为网络宽带一样的使能技术,催生新的商业形态。

从战略规划层面看,蚂蚁集团确立“AI First”方针,这是基于自身大规模业务场景需求所做出的决策。蚂蚁集团着手布局多项AI前沿技术,涵盖大模型、知识图谱、运筹优化、图学习以及可信AI等领域,构建起自身技术体系。

在2024外滩大会上,蚂蚁集团集中一口气推出多项成果:发布AI生活管家App“支小宝”,聚焦日常生活服务;升级AI金融管家 “蚂小财”,主打金融专业智能服务;推出面向医疗及泛健康行业的“AI健康管家”,开拓健康领域智能化应用。

同时,蚂蚁集团启动支付宝智能体生态开放计划,上线智能体开发平台“百宝箱”,吸引外部开发者参与,丰富生态多样性。

此外,蚂蚁以百灵大模型为核心驱动力,为各应用赋予多模态理解与生成等能力,推动产品稳定运行与焕新。如2024年支付宝五福节,百灵大模型服务近6亿人次,让大众通过AI互动玩法感受新年氛围。

蚂蚁AI发展路径也不止于内部研发,还通过投资与合作拓展边界。2024年,其投资与成立多家AI相关企业,比如12月在上海成立 “上海蚂蚁灵波科技有限公司”,聚焦具身智能领域;8月领投秘塔科技超1亿元新一轮融资,推动AI搜索技术发展。

此外,支付宝在垂直行业持续泛化AI能力,如针对政务场景打造了政务AI解决方案,推动民生服务分发效率提高 50%,发挥了AI在实际场景中的作用。

大模型的竞技是一场关于技术、资金、人才的比拼。AI能否开启蚂蚁集团诸多新业务大门,助力蚂蚁集团塑造新形态,实现新一轮成长蜕变,值得期待。