编辑|Youli
6 月 10 日下午,今年的全国高考到这里就要正式结束了,但考验还在继续。
在踏出考场的那一刻,考生和家长就要面临着,在有限时间里,面对近 3000 所高校、2000 多个专业,不同省份、批次、选科要求下的复杂规则,以及考生个人喜好、就业规划等众多因素组合而成的超上亿种理论组合中,做出「抉择」,这并非易事。
对于学生和千万家庭来说,这是一场庞大的「信息战」,更是一场关于未来方向的「决策大考」。当然,市面上不乏志愿填报咨询服务,但动辄数千元的高昂费用,注定不是每个家庭都能承担,无形中更是放大了城乡、地域之间的信息鸿沟。
那么,在 AI Agent 重构一切的当下,在高考志愿填报这一场景,Agent 是不是也可以做点什么?
6月10日,千问上线国内首个全周期高考志愿填报 Agent,并宣布免费向全国考生开放,提供志愿填报和咨询服务。
资料显示,这一志愿填报 Agent 是基于千问高考志愿大模型和夸克 8 年高考数据经验打造,具备「志愿报告」「志愿日历」「志愿问答」三项核心能力,从头到尾跟进考生的高考志愿填报全流程,相当于为每位考生配备了一位贴身的 AI 高考志愿填报专家。
而在这背后有着众多值得追问的问题:当 AI 从聊天框走向人生决策场景,它到底能做什么?是否能真正抹平志愿填报中的信息差?在这样一个高风险场景里,AI 又该如何保证准确、可靠、可信和克制?
带着这些问题,在发布会后,机器之心第一时间和阿里巴巴集团副总裁、千问事业部总裁吴嘉聊了聊。
以下为吴嘉和媒体交流实录,在不改变原意的情况下,部分内容略有删减:
提问:从夸克到今天的千问高考志愿填报 Agent,阿里做高考服务已有 8 年,初心是什么?
吴嘉:8 年前我们做这件事是希望夸克能成为年轻人的「智能助理」,进入 AI 时代,千问的使命更加直接:不仅是一个 ChatBot、工具角色,更希望是一个有记忆、会思考的 Agent,真正帮助用户在真实世界或数字世界里办事、执行任务、解决实际问题。无论是之前的点奶茶、打车等服务,还是今天的高考志愿填报,其实都是在这一脉络下进行的。
而在新的高考环境下,众多高校、专业、地域等因素组合,再加上 AI 等新形势下的专业变革,填报志愿变成一个极其复杂的决策,可很多考生和父母极度缺乏背景知识。当然,市面上也有有能力的专家,但收费非常贵,动辄 5000 元以上。
AI 时代一个核心的社会价值就是弥合「信息差」,我们坚持做这件事,就是希望通过 Agent 技术,让每个人都能免费获得最终的志愿目标,这具有很重要的社会意义。
提问:高考志愿填报 Agent 的本意是为了弥合「信息差」,但如果有些人更会提问、使用,有些人则不会,是否又会产生新的「AI 使用差距」?
吴嘉:如果在传统的 ChatBot 任务系统里,会提问和不会提问,输出结果确实天差地别,但高考志愿填报 Agent 是以 Agent 形式推出,而Agent 的核心能力就是「上下文对齐」。这也是我们选择 Agent 的一个主要原因。
这意味着,它能「变被动为主动追问」:模型很清楚志愿填报的核心要素,当用户无法一次性表达清楚需求时,Agent 还会主动反问和追问,弥补用户背景知识的不足。
同时, 我们还引入独立的记忆模块,考生生成志愿报告后,可以随时回来修改、调整、刷新,而所有的调整都会被作为多版本完整保存。
此外,就是「志愿日历」这一核心能力,它把一个长达数周、极其复杂的填报周期,拆解成了每天清晰、主动规划的具体任务。
比如你是杭州的考生,日历会主动提醒你 6 月 24 日出成绩,并实时推送相关院校的最新招生简章等,考生和家长只要跟着任务走,甚至不需要主动去想怎么提问,这就大幅降低了门槛。
还有一点就是极简交互,我们增强了语音输入等功能,用户可以打字、语音对话等,随便讲,后台则会帮其进行解析,充分理解用户的表达和意图。
提问:去年阿里就发布了「高考志愿大模型」,而千问高考志愿填报 Agent 是基于全新高考志愿大模型打造,为什么不直接用通用大模型来做?技术局限性在哪?
吴嘉:阿里自始至终只有一个统一的千问大模型底座。我们是在这个统一模型上,通过强化学习建模与监督微调,极大地增强了它的高考复杂推理能力。而面对复杂场景,通用大模型缺乏领域知识和平衡「冲稳保」的专家经验,为此,我们提取了海量资深规划师的思考路径,将其转化为多轮对话数据,让模型形成了「规划、执行、反思」的推理机制。
只是在用户从千问「高考入口」进来时,我们默认他是有高考需求,模型也会开启更复杂的思考模式。
提问:高考志愿填报是一件容错率非常低的事情,可模型的幻觉往往只能降低,而非「消灭」,在这一点上,团队是如何做的?
吴嘉:确实,高考是一个非常严肃的场景,需要很高的准确率。单纯从模型技术角度看,幻觉很难 100% 消除,但如果从 Agent 角度思考,问题就完全不一样。
Agent 和普通 chatbot 最大的区别是,它有自我认识能力、记忆能力,也有和用户进行上下文对齐的能力。普通 ChatBot 接到任务后,会直接检索、回复、生成,它不知道自己的边界在哪里,也不知道返回的数据里是否真的有答案。
但高考 Agent 不一样,它知道自己要提供的是高考志愿填报服务,知道可以依赖哪些数据库,也知道哪些数据没有就不能轻易推理。
比如某个省 2025 年的分数线还没有出来,Agent 应该告诉用户「这个数据还没出,可以等两天再更新」,而不是「编」一个分数线给用户。
同时,我们这次提供的「志愿日历」「志愿问答」「志愿报告」几个产品形态,让模型很清楚自己能使用哪些工具和数据,数据更新到哪里,数据不对时该如何反映,以及如何引导用户表达更多真实需求。
另一个很重要的能力是,Agent 会主动和用户对齐上下文。它能代理用户填志愿报告的前提是必须知道用户要什么样的志愿方案,知道他的分数、选科、省份、偏好等,如果条件不足,Agent 不会轻易给答案,而是会持续追问用户。
所以,Agent 不是用户问什么就答什么,它需要长期服务、主动追问、记忆用户需求、自我更新,也需要根据工具返回结果进行反思…… 这些能力都不是单一 ChatBot 能做到的。
提问:为了建立用户对 AI 报考的信任,在给出的填报方案中,千问是否会明确告知用户哪些是确定性数据,哪些是模型推理,以及哪些需要用户自己做出判断的?
吴嘉:首先,AI 产品给用户带来信任感,关键不在于它是不是一个「黑盒」,而在于它的「思考方式」和「执行过程」。如果大模型拿到输入直接「砸」给用户一个输出,那信任感是很低的。
而千问高考志愿填报 Agent 会把它的内在逻辑、判断理由,个性化地展现给用户,像个真正的「助理」一样聊起来,并且能够做到高标准的「复杂指令遵循」。
另外,当然,我们会在问答和报告里做明确的设计,所有重要数据(如分数线、位次)都是带下划线的,用户只要点击,就能点击溯源,看到这个数据是从哪个具体数据库里调出来的,以此保障可信度。
提问:春节以来,千问一直在做闪购、打车等 AI 办事场景。这次做高考志愿服务,是不是也是千问一直强调的坚「AI 办事」方向的延伸?
吴嘉:是的,这是一个很重要的延伸。
在消费领域,很多服务追求的是丰富性,以及对用户个性化需求的理解,但任务长度和复杂度没有「高考」这么高,而高考志愿填报则是我们第一次用 Agent 在真实世界里解决一个相对复杂的问题。
从 ChatBot 走向 Agent,也是整个行业的大趋势。
Agent 能力是 AI 非常重要的一个能力,本质上是把不管是企业内部经验,还是社会专业经验等真实世界里的经验,让模型能够学会,并在此基础上提供更好的服务。而这也是千问一直努力的方向。
提问:如今,千问的「AI 办事」能力、领域范畴都在不断扩大,面向未来,千问究竟想要成为一个怎样的产品?
吴嘉:我们的目标是做中国最好的 AI。
我们的布局很清晰:千问 PC 版将面向非常纯粹的生产力场景,从信息收集、Work 到 Coding,面向超级个体、个人工作者提供最强生产力工具。
而在移动端,千问依然定位为一个「综合助理」,并打通多端(包括我们正在做的眼镜端)等。
在大模型时代,产品不再需要死板的「意图分类」或「流量分流」,对大模型来说一切都是 Context(上下文),用户要闲聊它能陪闲聊,要工作它就调动工具帮你办事,「All in one」是一个巨大的趋势,为用户在对的场景提供合适、省心、有深度交付完美度的服务,才是最重要的。
热门跟贴