有深度 有广度
就等你来关注
编辑:Yuki | ID:YukiYuki1108
AI智能体(Agent)正处于一个全新的发展阶段。从以前主要服务C端市场的聊天机器人,比如ChatGPT的GPTs、百度的文心智能体、字节的扣子、Kimi+等,到现在,它们的定位大多是智能助手,虽具有一定实用性,但距离像贾维斯那样个性化、高度智能的助手仍有距离。
如今,我们不仅希望AI成为一款好用的工具,更希望它成为一个深度了解我们的合作伙伴,能够在工作、生活、娱乐等多领域中,自主地提供灵活的帮助。
根据Sam Altman的AGI层级框架理论,当前的AI系统已经从最初的“聊天机器人”发展到更复杂的“推理器”,能进行更为精细的分析与问题解决。例如,O1模型能够进行高难度的推理任务,执行复杂的Python编程任务。
而第三级的AI智能体则标志着AI自主性与决策能力的飞跃。当前,已经有一些初步的AI智能体展现出这些特征。例如,10月23日发布的Claude 3.5 Sonnet就引入了Computer Use功能,使AI能够像人一样操作计算机,查看屏幕、点击按钮、输入文本。
国内的AI也迅速跟进。10月24日,智谱发布了AutoGLM模型,其网页版插件AutoGLM-Web,能够模拟用户浏览网页,自动完成高级检索、总结、内容生成等任务。
而手机端的AutoGLM Phone Use功能,让AI能够像人一样操作手机,只需要语音或文字指令,AI就可以完成微信、淘宝、美团、小红书等八大应用的任务。
目前,AutoGLM的网页版和手机端都在不断完善中,虽然手机端的功能仍在内测阶段,但已经具备了许多实际的应用能力。
例如,在小红书上搜索热门内容,总结旅行攻略,或者在美团下单外卖、在微信发送消息、在大众点评写评论等,AI都可以高效完成。
不过,AI在执行任务时仍存在一定的局限性。例如,当要求它批量点赞朋友圈时,AI的处理速度和准确性都有限;而在进行一些多步骤任务时,AI的表现也显得不够流畅和高效。
比如,给领导朋友圈点赞时,AI能够自动完成点赞,但并没有按照顺序操作,而是选择性地点了一些帖子。这说明AI在完成长时间、多步骤任务时仍不够精确。
此外,在一些简单的任务上,AI的表现还是能为我们节省不少时间。比如,在点外卖时,AI能够根据我们提供的条件(如“不辣”、“25元以下”等),快速找到合适的餐厅,并直接完成下单。但当指令不够明确时,AI仍需要多次交互才能准确理解用户的需求。
在写评价和总结文章等任务中,AI的表现也有一定的进步。例如,帮助撰写大众点评和淘宝复购评论时,AI能够根据我们的要求生成相关内容,尽管偶尔会出现语音识别错误,或者操作流程不太流畅,但它的基本能力已显现出来。
对于需要AI帮助的任务,例如写总结、查找菜谱、打车等,AutoGLM都能应对自如。尤其是在需要多个App同时操作时,AI的表现还是较为出色的。例如,在高德地图上打车,AI能够根据指令自动完成任务,虽然在处理复杂指令时可能会遇到一些问题,但整体体验较为顺畅。
当然,尽管AutoGLM在某些任务上表现优秀,但仍需继续改进。首先,AI在进行多任务操作时,仍需要提升其理解和处理能力。其次,当前的AI智能体还不能完全代替人类的细致操作,特别是在多次交互或复杂指令的情况下,仍需用户多次确认和操作。
从整体来看,AI智能体的发展势头强劲,尤其是在手机和计算机操作上的应用,正在为我们带来更多的便捷。未来,随着技术不断进步,我们可以预见AI将在更多领域展现出强大的能力,不仅能完成简单的任务,还能够逐步承担更多复杂决策任务。
然而,尽管AI技术不断迭代升级,用户的信任与使用习惯仍需时间来培养。特别是隐私安全问题,仍是用户关注的重点。我们需要更为完善的技术支持和法律监管,以确保AI智能体能够在保障隐私和安全的基础上,提供更加智能和高效的服务。
从目前的发展趋势来看,AI智能体的未来前景非常广阔。随着越来越多的公司将AI整合进自己的产品中,不仅微软、谷歌等科技巨头,连手机厂商也在不断推出新的AI功能。
例如,荣耀的Magic7就已实现了YOYO智能体帮助用户点咖啡的功能,而苹果也计划将ChatGPT整合进Siri中。AI智能体是否能够成为主流,未来几年我们会看到答案。但无论如何,AI智能体无疑是正在改变我们生活和工作方式的重要力量。
热门跟贴