谁曾想,ChatGPT最大的对手会是一家汽车厂商打造的人工智能App呢?
2023年6月,理想汽车推出了自研认知大模型“Mind GPT”,它以“理想同学”App的形式出现在理想汽车的车机中,支持通过自然语言交流、发送指令。2024年,Mind GPT升级到3.0,带来了行业领先的自然语言任务执行功能。理想汽车创始人李想在2024年25日举行的AI Talk特别活动中提到,理想同学已经是理想车主们最爱的功能之一,如今理想要让更多用户用上理想同学。
(图源:理想同学)
今日,理想同学App如期登陆App Store。为了弄清楚车企打造的首个通用人工智能应用程序到底表现如何,雷科技第一时间下载了这款应用,并将它与Kimi、豆包、ChatGPT等热门应用来了一场比拼。
理想的极简风,刮到了“理想同学”上?
理想同学App的设计相当简洁,但却不够明了。App图标是简笔画风格的一双眼睛,有人觉得这和蔚来的Nomi有点像,对比下来,小雷感觉蔚来Nomi还是要更可爱一些。可相比起其他AI应用的“赛博风”,理想同学倒是有几分亲近感。
(图源:雷科技制图)
启动App后,理想同学会跳出欢迎界面,随后就是注册/登陆请求。理想同学没有限制必须理想车主才能使用,因此小雷的整个登陆过程都是相对顺利的。相较之下,豆包的登陆更像是开始一场游戏,它需要你建立昵称、性别等个人资料,Kimi、ChatGPT和理想同学都没有这个要求。
虽然理想同学整体就是黑+白配色,没有启动广告、也没有任何内容推荐,甚至连教程都没有。或许理想是默认多数会下载理想同学的用户都不是“新手小白”。
(图源:雷科技制图)
有趣的是,理想同学的推荐问题往往都是投资、科技类话题,而豆包则是偏生活常识类,这或许就是它们各自定位的巨大差异。另外,Kimi、豆包都会将能够实现的功能放在输入框附近,这能让用户快速了解到它们到底能做些什么。比如豆包把AI生图、AI翻译、AI写作都列了出来,Kimi也把翻译和写作单独显示,但理想同学却没有这么做。
当你开始提问后,理想同学会显示一段非常炫酷的动画,展示它理解、搜索、学习、总结的过程。在开始回答问题后,这段思考过程会被折叠。小雷认为这段动画没有什么必要存在,毕竟每个大模型的生成过程几乎都是一样的,这段动画也说明不了什么,而且还相当占位置。
(图源:雷科技制图)
只能说,对于这个刚刚上线的人工智能应用来说,理想算是很努力地做减法,走极简化风格使其在视觉上足够高级,但这类应用最重要的还是要“好用”,而不是“好看”。不够直观的交互,上手门槛就被无形中抬高了不少。
对垒Kimi、豆包:基础相当,创作拉胯,视觉还行
聊完设计与使用上的体验,也是时候到实测环节了。
本轮测试主要分为三个环节,包括基础问答、内容生成和连续交流。小雷为理想同学挑选的对手有豆包、Kimi和ChatGPT。话不多说,我们直接开始PK吧。
第一轮是基础问答横评,我们选择了理想同学推荐的“马斯克xAI为何能吸引60亿美元投资”这个话题,对四款人工智能应用进行提问。
总结速度方面,理想同学从开始搜索到生成回到大约花费了3秒时间,而豆包、Kimi分别需要6、7秒时间,ChatGPT和理想同学的生成时间相近。而内容上,四款应用都有从市场、背景、技术战略等多方面进行论述,但只有Kimi能够结合xAI当前的状况详细描述,比如提到xAI截至5月已经融资超120亿美元,这节省了我们后续提问的时间。
(图源:雷科技制图,从左到右为:Kimi、理想同学、豆包、GPT)
整体来看,目前主流人工智能应用在基础问答基本都做得不错,比如资料检索能力、整合能力和生成能力,即便是初出茅庐的理想同学也能稳拿六十分。当然,体验下来,小雷认为Kimi的优势在于总结的资料更全面,豆包的优势是能直接推荐今日头条、抖音上的解说视频。
第二轮是内容生成,我们挑选了“雷科技即将前往美国参展CES2025,请根据这个由头编写一篇宣传导语”这个任务,让四个人工智能应用自由发挥,帮我们写一篇宣传语,看看他们各自的表现如何。
从生成的内容上看,豆包和理想同学都能了解到小雷的需求是“宣传导语”,因此内容篇幅不会太长,满足社交平台或文章尾部的宣传需求;Kimi的内容是四款人工智能应用中最长的,甚至还包括了“2025年1月7日-10日”这个准确的时间,但可惜就是太长了,而且还把雷科技认错成参展商。至于ChatGPT,内容就比较平平无奇了,而且AI味也很重,实用性不佳。
(图源:雷科技制图,从左到右为:理想同学、豆包、Kimi、GPT)
我们又将理想同学推荐的问题“谷歌AI如何在生成视频和图像上实现突破”为命题作文,要求四款应用按照这个主题写一篇文章。不过,测试下来,Kimi、豆包、ChatGPT都能按要求写一篇文章,虽然水平参差不齐,但至少还是能完成要求,而理想同学则是回答了这个问题,并不能独立完成写作。
(图源:雷科技制图,从左到右为:Kimi、豆包、理想同学、GPT)
这样看来,理想同学倒不是完全不能写作,只是过大的命题对于它而言还是有一定难度,从内容完成度来看,其实也只有豆包算得上是完成了一篇正规的文章写作,Kimi更多还是以资料举证为主,没有分析和论述。只能说,理想同学在写作这块还是得加油。
值得一提的是,目前Kimi和理想同学都不支持图像生成,其实也算是时下主流厂商推出的人工智能应用里比较罕见的不支持图像生成模型技术的应用了。
(图源:雷科技制图)
第三轮,我们迎来了这次体验的重头戏:视觉模型对比。由于Kimi不支持视觉模型、豆包只支持语音模型,这次的对比主要还是理想同学和ChatGPT之间的对决。
理想同学和ChatGPT都能通过摄像头对现实物体进行识别,但两者的处理方式有些区别,前者只有在用户发出需求时才会给予回应,例如识别物品是什么、人物是谁等;而ChatGPT更倾向于实时交流,只要摄像头采集到画面,它就会开始与你交流。
(图源:雷科技制图,左为GPT、右为理想同学)
体验下来,单纯聊物体的识别能力的话,两者可以说几乎没有差距,像是生活中常见的矿泉水、电脑,都能认出来。而犯的错误也几乎一样,比如认不出新款的手机,或是冷门的数码产品等。但是在速度上,理想同学的表现还是很不错的,而且它的语音识别能力很强,能准确分析你是真的在向他提问还是在与旁人交谈,避免了错误的实时分析。
而在植物的识别上,理想同学能够识别出园区种植的观赏性植物是冬麦,并且给出了一些简单易懂的资料,而GPT却认为那些草是韭菜。当我继续追问“这些观赏性植物真的是韭菜吗?”,GPT建议我可以询问工作人员。不得不说,理想同学在这方面的识别能力几乎是完胜ChatGPT。
(图源:雷科技制图,左为理想同学、右为GPT)
当然,理想同学也并不是方方面面都胜于ChatGPT,比如我问它今天的天气看起来怎么样时,理想同学始终会引用气象资料来判断,而非识别实景;ChatGPT就会告诉我现在的天气看起来不错,但可能需要穿件外套,避免着凉。
对比下来,理想同学作为一款刚刚上线的人工智能应用,在处理基础任务时已经和Kimi、豆包、ChatGPT这些老玩家相差无几,但要说到文字创作、内容生成,可能还是略显生涩。而理想同学目前最大的优势是视觉模型表现很不错,这可能是Mind GPT的数据模型与大量的视觉需求有关。
车企下场做AI应用,醉翁之意不在酒?
在日前举办的“AI Talk”特别直播活动中,李想透露自Mind GPT在理想汽车上线后,“理想同学”累计唤醒次数达23.8亿次,任务完成率96%,用户满意度96.2%。作为车企推出的车机AI助手,能够这样的唤醒率,表现确实不错。
但理想为何要把车机的AI助手搬到应用市场上,与一众老玩家们硬碰硬呢?
实际上,李想在2023年就曾通过内部信提到理想汽车的未来愿景——至2030年,要成为全球领先的人工智能企业。在“AI Talk”活动中,理想也宣布全面进军AI市场,理想造的汽车也不是“汽车”,而是“人工智能机器人”。这其中最重要的一环,自然是大模型技术。
时下,几乎所有人工智能企业都拥有公开的AI应用,百度的文心一言、谷歌的Gemini,即便是没有造出一款全新的AI应用,也计划在主流产品中全面AI化改造,例如马斯克的“xAI”计划。因此,想要大众认可理想是一家人工智能企业,最好的办法就是通过部署一款每个用户都能轻松下载到、使用到的应用——理想同学。
(图源:雷科技制图)
对于理想而言,理想同学上线应用市场,这意味着将会有更多普通用户加入其中,共同训练Mind GPT,使它变得更加完善,无论应对任何场景,都能有更好的应对方式。此前,Mind GPT主攻的场景是“任务主导型AI”,即用户给一个清晰的指令,理想同学负责执行便可。但这对于要“造人工智能机器人”这个愿景而言,还远远不够。
而体验下来,理想同学距离Kimi、豆包、ChatGPT等专业AI玩家仍有不小差距,尤其是面向创作方向的特性,理想同学差的不是一星半点。假如理想要让消费者们认可“理想是一家人工智能企业”,或许要加快理想同学升级,跟上主流AI应用脚步。
25年1月7日,CES(国际消费电子展) 2025 即将盛大开幕,雷科技报道团蓄势待发,即将飞赴美国·拉斯维加斯现场全程报道,敬请关注。
热门跟贴