01
智能助理迎来“PhoneUse”时刻
“给老板朋友圈的第一条点赞,并写一个彩虹屁评论。”
“帮我导航到渝中两江丽景酒店”
“在美团上点一份黄焖鸡米饭。”
你能相信只用“说”,就能让手机自动实现上面的操作吗?假如你正在做饭、洗漱、洗澡、运动、开车、忙着工作的时候,突然有一个事情要在手机上完成,而你抽不开手,很好地解放你的双手。
当不少人对AI助手的理解还停留在“一问一答”“内容检索”时,AI的“PhoneUse”时刻已悄然降临。
用户只需通过语音或文字向手机发出指令,以AutoGLM为代表的AI助理如今已能够自动开启各类应用,如淘宝、美团、微信等,实现网购、订餐、抢红包等功能。理论上AutoGLM可以模拟人类在电子设备上做的任何事情,这项技术的背后是智谱自主研发的基础智能理解耦合中间界面和自进化在线课程强化学习框架,充分展示了现代人工智能的潜力。
而这样的“愿景”或“场景”离普通用户究竟有多远,又或者说普通用户在不更换手机的情况下,能否体验到AI助理的便利呢?
02
AI助手全面接管手机
人工智能之父John McCarthy曾说:“只要AI可以开始正常工作,就不会有人再把它当AI了。”如今,这一预言正在逐渐变为现实。
AutoGLM目前还处于内测阶段,申请入口在智谱清言APP中,直接跟AutoGLM内测申请小助手对话提交申请即可。这里其实非常有意思,相较其他内测AI木讷的“填表式”申请,智谱通过对话引导用户完成内测申请,初步交互体验非常不错。
通过申请后,我们即可再次根据引导在手机上安装AutoGLM,其目前对硬件性能并没要求,只要是安卓设备都可以安装使用,不过这里要提醒大家的是因为AutoGLM数据的获取和操作,都是通过安卓的无障碍权限来控制的,因此用户登录AutoGLM后的第一件事情就是引导你去开启无障碍权限和悬浮球权限,不然就没有办法继续体验。
进入AutoGLM首页后,在首页右上角有个能力范围提示,里面写了AutoGLM当前具体能做哪些事情。目前,智谱的AutoGLM可适配微信、淘宝、美团、小红书、大众点评、12306、携程、高德地图共8款应用,随着适配和迭代的推进,应该很快就会有更多软件被纳入能力范围。
完成基础的设置和了解后,用户即可返回手机主界面,这时,AutoGLM会以悬浮按钮的模样出现在手机屏幕角落上,用户在需要使用时点击即可启动。
以淘宝电商购物为例,笔者只需说出“帮我在淘宝上购买得力刷题笔”这样的模糊指令,AutoGLM即会为我启动淘宝并开始自动检索,当遇到多款商品出现时,AutoGLM还会以语音的方式告知用户当前遇到多个可选项,让用户选择,这时,用户继续通过语音交互即可让AutoGLM明确下一步选购方向,并最终停留在具体一家店铺的一款商品上,不过付款环节还需用户人工确认完成,这点显然是为了解决用户对安全性的担忧。
而这样的模糊语音理解在微信朋友圈点赞并评论时更让人惊喜,笔者只是说出“为胡子叔叔朋友圈点赞并评论”这样的话语,既没有给出完整的微信好友ID,也没有明确给出想要评论的话语内容,AutoGLM却能在数百好友中准确找到“胡子叔叔XXXX摄影”,完成点赞操作的同时,自动生成一条评论。
面对这样的AI助理,笔者甚至有考虑过是否让AutoGLM帮忙给我所有的微信好友朋友圈点赞了,从而轻松表达我对好友们的关心。
AutoGLM能够实现上面两个步骤已经让人非常惊喜了,这意味着AutoGLM成功迈过了从“听懂”(理解人类语言)用户指令到“交互”(生成内容和回答)的阶段,成功实现了“自主执行任务”,这并非简单地点击、确认,而是需要AutoGLM对于屏幕内容信息进行解读与判断的,尤其是在淘宝购物中,笔者下达的模糊指令并未明确指示AutoGLM在怎样的商户下单购买,其最终却能自主判断并挑选出卖家店铺,“自主执行任务”表现良好。
而AutoGLM对于内容的“阅读”和“理解”能力笔者打算通过小红书尝试,向AutoGLM下达“查找小红书上关于学而思学习机人气最高的帖子”,整个流程和购物、朋友圈点赞没有太大区别,仅耗费几秒钟时间,AutoGLM就语音提示已为我找到相关帖子和内容。
显然,AutoGLM不仅能够清楚理解用户指令,而且在其启动和检索的信息中,能够根据自己的理解进行操作。值得一提的是AutoGLM其实每次操作之前都会出现一个对话框,如果其对用户语音识别有误的话,用户可以手动点击修改指令,双重保障操作的准确性。
当然,在体验过程中我们发现AutoGLM仍有许多值得改进的地方,诸如“帮我订回家的机票”这样的复杂请求,需要更明确的信息支持,一些常用的App如滴滴、京东等尚未适配,也亟须各方的努力补齐,而常见简单任务也有一定的失败概率。此外,它对一些个性化指令的执行仍显不足。这些除AutoGLM自身不断迭代可实现外,用户的个性化需求依然需要通过与手机厂商的进一步合作来实现。
经过体验,笔者发现AutoGLM完全能够满足从浏览网页到下单购物,再到订酒店、订机票、设置导航的主流应用,而AutoGLM并不仅限于简单的应用场景,它的目标是“做你在手机上能做的所有事情”,这得益于它对手机界面的深刻理解和强大的学习能力。
为了让AutoGLM不断学习,智谱团队研发了“自进化在线课程强化学习框架”,这样AutoGLM可以像人一样,通过不断地学习和实践来变得越来越强大。它不仅能学会新技能,还能自我纠正和改进,保证在实际应用中能越来越好地满足用户的需求。
这恐怕也是AutoGLM当前能够放出来让大众“内测”的主要原因,通过不断的语料投喂,AutoGLM能够在一次次纠错中变得更聪明、更理解中文语义,从而做到更懂用户。
03
编辑点评
压力给到Apple Intelligence
当果粉们还在关注Apple Intelligence何时能进入中国市场时,智谱已经在为AutoGLM构建生态圈了。
智谱提出了MaaS(Model as a Service)商业化路径,并针对不同类型客户群体的需求提供多种商业解决方案,其目前已与荣耀等知名手机厂商建立深度合作关系,设立AI大模型技术联合实验室,将为未来的产品开发和进一步优化打下基础。
这种跨界合作将有效推动AI助理在终端市场的快速落地,助力用户体验及满意度的提高。此外,智谱AI还通过发起多项基金支持开源生态建设,加速国内AIGC应用的落地和发展,这种开源和生态建设策略进一步巩固了其在行业中的领先地位。
显然,在落地和生态建设上,智谱AutoGLM已经领先Apple Intelligence不止一个身位了。相比之下,Apple Intelligence虽然也在不断推进其AI功能的落地,但其主要集中在苹果的封闭生态系统中,并且中文版本要到2025年才能体验。尽管Apple Intelligence在提升用户体验和隐私保护方面做出了努力,但其开放性和生态建设速度似乎不如智谱AutoGLM。
不过最后笔者想要提醒大家的是从应用到设备,当AI助理开始接管我们的数字生活时,人们在日常使用中可能会慢慢依赖于这类技术,进而改变他们与设备之间的互动方式。面对这样的变革,你是否真的愿意交出自己的手机控制权?
欢迎通过邮局渠道订阅2025年《电脑报》
邮发代号:77-19
单价:8元,年价:400元
编辑|张毅
审核|吴新
爆料联系:cpcfan1874(微信)
壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者
热门跟贴