不久前,退网多时的李想再次出现在公众视野。归来的李想一改往日单人演讲式的发言方式,选择了用接受媒体采访的对谈方式,探讨了理想汽车在人工智能领域的战略布局和未来愿景。
当然,形式虽然变了,但李想依然理想,本次对谈保持了他一贯高信息密度、体系化的谈话输出。
上一次还是在2023年春天,李想选择的主题是如何理解造车。这一次,李想的主题已经进化成了如何理解AI,以及,如何用造车通向AGI。
对这一次主题略显宏大的谈话,各方质疑正如采访者张小珺所问:一个造车时选择用增程开局的实用主义者,怎么似乎突然间变成了拥有宏伟AI愿景的理想主义者?
李想没有直接回答,但三小时的问答和理想过去九年的实践,本身构成了回答:做不做AI对他来说不构成问题,何处切入AI,何时All in AI,如何做好AI,才是真正的问题。
为什么从造车All in AI
作为一个相信AI的创业者,李想为什么不直接做AI,而要从造车切入AI?
看起来和问题关系不大,但最底层的回答是:为了更好地改造物理世界。这个答案的产生,则要追溯到十年甚至更早之前。
2013年,汽车之家在美上市,市值突破30亿美元,成为国内最成功的汽车网站。这段创业中,李想培养了对市场的需求洞察、对产品的精准定义的能力,也锤炼了带队打胜仗的能力和对创业节奏的把握能力,同时,积累了财富和投资人的信任。
但李想创业最大的遗憾也恰恰来自这段经历——选择的创业领域过于垂直,以至于“为了一棵树,错过了一片森林”。
李想不止一次地用零售电商和汽车电商的命运分野,分析了这种遗憾。
在移动互联网热潮期,零售电商们不仅在线上提供了交易平台,也显著地改变了零售在线下的仓储、物流、交付等环节,革命性地提升了效率。基于对现实中零售业态巨大改造释放出的价值,零售电商成长出多家千亿乃至万亿级企业。
同一时期,汽车之家与其他同行尝试用电商改造汽车零售,却均以失败告终。究其原因,汽车交易有更多无法被压缩的环节发生在真实的线下而非虚拟的线上。对于一家大部分业态都在互联网上,自身体量又有限的企业,大规模改造汽车交易还是太难了。
零售电商与汽车电商截然不同的结局,带给李想的是两点略微苦涩的启示:
一是一家企业的价值,归根结底要用“多大程度改变了物理世界”来衡量;
二是物理世界虽然还有广袤的改造余地,但基本已是难啃的骨头,互联网打法显出疲态,得使用更先进的业态和技术。
当李想在2015年再次出发创业,正与AI合流的新能源汽车不意外地成为最佳选择。
作为新一轮能源革命和信息革命的交汇点,智能电动汽车兼具移动、空间、软硬件、大规模制造属性——很少有其他产业能像它一样,如此多维地和物理世界产生关联,又积极地拥抱最新的技术潮流,这为AI发挥作用提供了充足空间。
加入造车大军后,理想的A面是将增程电动、家庭用车做大做强,B面则可套用一句老话,“用AI把汽车的各个环节重做一遍。“
其中能见度高的AI产品,是智能助手理想同学,以及端到端+VLM架构的智能驾驶。数据显示,2024年理想同学累计唤醒23.8亿次,累计智驾里程超过29亿公里,在国内车企中居于领先位置。
领先的先决条件是饱和投入。2024年,理想的百亿研发费用,近一半用在了AI上,让理想将关键的AI能力掌握在自己手里。
比如国内多数车企的智能助手选择调用第三方大模型能力,理想则为理想同学自研了基座模型Mind GPT。在智能驾驶领域,理想的团队率先量产了采用端到端+VLM双系统架构的智能驾驶,将自家高阶智驾车型销售占比提升至50%以上。
在不易被外界关注的环节,理想也在使用AI为生产经营提质增效。
比如在零售、营销、客服、财务、 金融反欺诈等职能部门,理想的智能商业团队部署了相应的AI模型来辅助工作。
理想整车生产流程中AI的存在感也颇高。比如理想一度被电驱NVH传统检测方法测不准、效率低的问题困扰,但在理想智能工业团队训练出一个AI检测模型,部署在电驱供应商的产线边实现就地检测后,难题迎刃而解。
类似的AI能力嵌入在生产制造的各个环节,串联起来则是被理想称为Li-MOS的智能制造操作系统。理想L6从上市发售到爬满2.6万辆/月的产能只用了不到两个月,带给行业一点小小的爬产震撼,其中Li-MOS的支持尤为重要。
到2024年,理想对物理世界的改造初见成效: 对用户,交付了上百万辆搭载理想同学和智驾能力的车型,改变了数百万人的出行体验; 对行业,提供了一套AI化的高效生产经营体系范本; 基于这些改造提供的价值,理想也成为一家千亿级公司。
李想在上一段创业中未尽的愿望,通过AI驱动的造车完成了序章。
为什么这时候All in AI
不过这不足以解释另一个问题:作为宣称对AI有信仰的一家公司,理想为什么不是在自动驾驶创业浪潮兴起的2016年All in AI,也不是在Transfomer大放异彩的2021年All in AI,而是在2023年才把AI作为阳谋,在2024年末才喊出了AGI的目标?
以李想的“创业节奏论”解释则是,一家企业不应在0-10的阶段,做10-100阶段的事。
OpenAI的例子表明,AGI很可能是有史以来最壮烈、复杂的商业/技术竞赛,它需要海量的资金、数据、算力,以及顶级人才,有着漫长的实现周期,竞争维度也超越了既有商业组织的边界。
以AGI为己任的OpenAI创立于2015年,汇聚了过去十余年AI领域的超级大脑,至2024年累计融资179亿美元且越亏越多,为了训练模型OpenAI几乎爬光整个互联网的公开数据,其最大股东微软为了提供算力支持,去年向英伟达购买了近50万颗Hopper GPU。
在这样的竞赛中,即使是市值万亿的顶级企业也心惊胆战。而理想如果没有选择“先造车,广积粮”的迂回路线,很可能连AGI的友谊赛名额都拿不到。
如果以AGI为目的地回望,理想成立这九年主要的经营目标可以总结为:度过企业的0-1、1-10阶段,找到一块有足够利润和数据产出的根据地,点出AGI的前置科技树,筹集AGI竞争的入场券。
正因为对创业节奏的理解,理想选择了以增程路线切入造车。同样,对节奏的把握也贯穿在理想打造AI产品的过程中。
比如在早期资源受限的情况下,理想在智驾产品上采取了跟随策略,同时做好了可以长期发挥效用的数据沉淀与基建工作,等待算力、算法、数据升级。在2023有了进一步的商业成功,智驾的营养系统——现金、算力和数据都足够充沛后,理想果断转向端到端+VLM,引领了技术范式,实现了智驾体验的快速提升,带动了高配车型销售。
这种变道超车一方面离不开智驾部门打硬仗的战役能力,另一方面也考验企业对内部能力、资源进行评估,对外部环境、需求变化进行感知,做出决断的战略能力。
理想在2024年末All in AI,实际是管理层进一步看到了内外部条件的变化,判断可以、也需要开启下一篇章:
于内,以理想同学和智能驾驶为代表,理想的AI产品在2024年打了胜仗,积累了数据,培养了人才队伍,收获了商业回报,AI能力的建设度过了1-10阶段,在认知智能和空间智能上都取得了一定建树,通往AGI的路径不再是空谈。
于外,无论是马斯克创办xAI,还是量化出身的幻方推出技惊四座的DeepSeek V3,都表明人工智能正在进一步打破不同类型企业的边界,在AI上不思进取会面临被跨行业而来的对手用AI端掉饭碗的风险。
但同时,在基座模型上领先的企业们,在Scaling Law的规则下一路狂飙后,终于撞到了一堵无形的墙——网络上的公开数据已经耗竭,接下来将考验垂直场景和物理世界数据的收集利用,成本与难度要高得多。而智能电动汽车恰好是一个足够大的细分场景,也是绝佳的物理世界数据生产终端。
对理想来说,All in AI最好的时机到了。
该用什么方式All in AI
选择全面躬身入局后,理想的AI方法论也依然带着鲜明的理想式烙印:把AI的产品做得更好,吸引更多人。
12月27日,理想AI Talk的最后一天,理想同学APP在App Store、小米应用商城等上线,这是车企研发的智能助手首次从车机进入手机。此前,车企的语音助手只搭载于车上,用在车内,服务自家车主,超出汽车场景与其他设备抢用户,会被认为偏离造车主线。
但这一“不务正业”的举动,在理想的规划中是通往AGI的必由之路。
一方面,只在车内单一场景发挥作用的智能助手,最终不可能是一个好的助手——用户很难指望一个在你开车时唠会儿嗑的对话机器人真的懂你。跨越不同的设备、场景,被足够多的用户使用足够长的时间,智能助手才会越来越智能,越来越好用。
另一方面,ChatGPT横空出世后,对话机器人成为AI最广泛的应用。更重要的,自然语言很可能会成为AGI时代最通用的交互入口,以对话形式与人交互的智能助手,将是最基本且普遍的产品形态。如果一家企业的目标是AGI,智能助手的产品打造和技术建设都是不可绕过的一环。
但将理想同学推向手机、进入更多场景,也意味着加入一个更激烈的战场,需要更强的实力。理想选择在基座模型上下功夫。理想新一版端到端多模态模型Mind GPT3o已正式上线为理想同学提供支持,其响应速度达到百毫秒级,能够理解不同模态,记忆、规划、工具、表达能力均得到提升。
李想向团队提出了目标,未来几年在国内保证理想大语言模型的基座模型位于行业前三,这是一个颇具挑战性的任务。
2024年末,国内排行前三的智能助手豆包、文心一言、Kimi月活分别约6000万、1300万、1280万,比理想同学的月活用户有一个数量级的领先,且同时登陆PC与手机,提供的能力也更多元。再次扮演追赶者的理想,势必要在2025年对Mind GPT的资金、人才密度进一步加码。
在另一头,去年让理想成功跻身智驾第一梯队的智驾团队,也并无闲暇享受胜利。因为理想智驾业务的阶段性目标并非问鼎L2辅助驾驶,而是实现有监督的自动驾驶即L3。
在2025年,理想将寻求高阶智驾产品能力的进一步提升,比如将接管里程提升至500公里。这需要更快地转动数据飞轮。理想预估,要达成接管里程500公里的目标,需要从50亿乃至100亿公里驾驶里程中,筛选2000万个老司机驾驶视频片段供端到端网络训练。
这是一项对数据和算力体系的魔鬼考验。但理想以每个月超2万辆速度扩充的高阶智驾车队,成倍增长的智驾里程,高度自动化的标注体系,以及8.1EFlops的云端算力储备,提供了可行性。
与此同时,理想也开始努力巩固在国内智驾领域“先进技术量产先锋”的地位。
在最新一版智驾系统中,理想将高速场景纳入到端到端架构,并首次推出了智驾的AI推理可视化——引入思维链技术, 在AD Max车型上展示端到端和VLM系统的感知、推理过程。
智驾系统对自身思考过程进行展现,是解决端到端架构黑箱难题的重要方法。打开神经网络的黑箱,既可赢取用户的信任,也便于智驾团队对问题场景追根溯源,持续提升智驾模型的能力。
用一句话总结理想在2025年的AI战略,便是理想同学和高阶智驾将继续作为理想AI拳头产品,成倍接入资源,获取更多用户,在产品形态和性能方面向上“摸高”。
理想之所以选择两手抓,是因为两者分别代表认知(语言)智能和空间(行为)智能,也是人类主要的两种智能表现方式。但人类能够将两种智能融汇应用,这是AI目前的短板。反过来意味着,如果能让AI同时掌握两种智能,很可能就找到了AGI的钥匙。
因此在All in AI的阶段,理想已经开启下一代基座模型VLA(视觉语言行动模型)的预研——目的是将认知智能和空间智能统一起来,让一辆理想像人一样同时拥有认知智能和空间智能,从而实现L4自动驾驶,成为李想定义中“你的助手”。三年之后,理想计划推出首款为L4级自动驾驶定义的汽车。
届时,或许就是理想开启机器人产品线,迈向打造“硅基家人”的开始。
编辑:罗松松
视觉设计:疏睿
责任编辑:李墨天
热门跟贴