当前,人工智能大语言模型最流行的概念当数“AI Agent(智能体)”,与普通的大模型智能单纯的输出内容相比,AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。智能体像人一样,它有记忆、有逻辑分析能力、有任务的拆解能力、问题的拆解能力和最后综合回来统一解决问题的能力。

我们在实践中注意到,对于智能体的上述定义,大部分大模型公司能够做到创造出不同性格或者有一定记忆能力的智能体,能够感知环境或给出决策建议。但在执行动作、独立解决问题上,往往还需要依靠外部软件,比如在大模型APP中直接要求其预订酒店,可能还需要跳转外部链接。

如果要让智能体做到执行“预订酒店”的动作,事实上需要大模型APP拥有一个完整的、囊括用户吃穿住行的生态。而纵览目前市面上符合这一要求的大模型以及配套APP,基于蚂蚁集团基础大模型“百灵”提供能力的支付宝智能助理是拥有执行能力的很好的案例。

支付宝智能助理通过在支付宝首页进行“下拉”操作即可唤醒,可以通过打字输入或者直接按住说话的方式语音与其进行沟通。

以下是仿照用户的日常需求,对住宿预订、出行服务、便民服务、医疗需求、吃喝玩乐五个方面进行实际测试的结果:

住宿预订

打开网易新闻 查看精彩图片

输入(语音或文字均可,下亦同):“我想预订一家附近的酒店,可以帮我预订一下吗?”

生成结果:支付宝出行酒店提供服务,直接提供了北京的三家酒店选项(可展开更多)。

继续输入:“可以找一家离我最近的酒店吗?”

生成结果:请问您要咨询哪里的酒店?

继续输入:“北京会议中心附近的酒店”

生成结果:支付宝出行酒店提供服务,直接给出了北京会议中心附近的三家酒店选项(可展开更多)。

点击上述选项单中的一个酒店,可以直接预订。

出行服务(火车、机票打车、骑行服务)

打开网易新闻 查看精彩图片

输入:“我想订一个明天从北京南站回到天津站的火车票”

生成结果:飞猪提供服务,提供了三张从北京南站去天津站的火车。

继续输入:“明天从北京南回天津,下午五点左右的高铁”

生成结果:飞猪提供服务,给出了17:28、17:33、17:37三班北京南至天津的高铁,点击即可直接通过飞猪进行火车票预订。

输入:“我想买一张从北京到三亚的机票,要七月份最低价的,有没有合适的?”

生成结果:支付宝出行机票提供服务,给出了一张7月1日从北京至三亚的机票,机票价格为732元起,点击选项即可直接通过飞猪预订。(注:经测试人员确认,这是测试日当天最低价格的机票)

输入:“周围有没有共享单车”?

生成结果:调出了哈啰、支付宝共享骑行、美团骑行三个选项(并可以展开更多),其中哈啰选项下面还有“查询附近的车”的子选单,点击后可直接通过哈啰看到附近的车的共享单车的位置。

便民服务(水电费缴纳、社保查询、经办)

打开网易新闻 查看精彩图片

输入:“我要给家里交电费”

生成结果:支付宝生活缴费提供服务,找到了电费、水费的可选缴纳选项,点击选项即可缴纳费用。

输入:“如何办理社保?”

生成结果:首先生成了“社保办理流程”的文字内容,之后调出了由北京市大数据中心提供的“社保经办机构”和“社保查询”两项服务,点击“社保经办机构”后,可以进入“京通”小程序进行相关政务操作。

医疗需求

打开网易新闻 查看精彩图片

输入:“我有些不舒服,可以帮我去医院挂号吗?”

生成结果:首先生成了如何挂号的文字解释,然后提供了“挂号就诊”选项,进入“挂号就诊”界面后,可以按照科室进行挂号,后续子菜单可以列出距离用户最近的医院,进入医院主页后可直接跳转医院小程序进行挂号。

吃喝玩乐

打开网易新闻 查看精彩图片

输入:“告诉我最近上映了什么电影,附近哪里可以看”

生成结果:首先生成了最近上映电影的名称和剧情介绍,如《云边有个小卖部》和《头脑特工队2》,并且调出了淘票票小程序,点击进入小程序后即可直接购票,并且还提供了“继续问”选项,如详细剧情介绍等。

输入:“附近有哪些比较好吃的火锅?”

生成结果:直接生成了附近火锅的具体位置,以及餐票评分、人均消费。然后调出了高德小程序,提供了包括上文中提到的火锅在内的3家火锅店的位置,并还提供了可供追问的信息,如“海底捞智慧餐厅的营业时间是什么时候?”

总结:

通过实测,发现支付宝智能助理可以在日常人们的普通需求中做到直接通过语音调出具体商家机构的小程序,以进行预订、购买等操作,同时,支付宝智能助理还具备优秀的上下文理解能力,比如继续追问,以及通过哪些文字内容调出哪些小程序。

当然,这除了蚂蚁百灵大模型的技术能力外,还和支付宝这一国内最大服务型超级APP拥有众多小程序生态有关,深植于支付宝平台生态,才能提供多元、准确的综合性生活服务。

文/罗亦丹

编辑/岳彩周

校对/卢茜