打开网易新闻 查看精彩图片

“我们很多研发的关键部分是AI驱动的,他给我安排任务。”

虽然被外界称作“教主”,但AI的发展还是给小马智行的CTO楼天城带来了一点冲击,不过对于AI给人派活这件事,他还是已经接受了。

因为随着模型能力的不断提升,AI在很多方面超越人已经不是一种科幻想象,而是已经走进现实。楼天城给亿欧汽车等媒体举了一个生动的例子,在小马智行两周前发布的2.0世界模型中,有时候人已经无法判断这一模型中哪里精度不够好,但是AI可以做出准确的判断。“你的世界模型里其他车变道都太激进了,你应该稍微收一点,AI能做出这样的判断。”

打开网易新闻 查看精彩图片

小马智行CTO 楼天城

而且,这已经是小马智行世界模型2.0的一部分日常工作,“就是AI自我判断出哪里不好,然后改进。”楼天城表示。

不过,AI虽然已经越来越强大了,可它们依旧离不开人,因为有一些工作必须要人来说,或者说——执行。

例如新模型下的实车测试和收集反馈,这些工作还是需要人来完成。毕竟,AI还“不掌握车钥匙。”

从低于人类水平,到接近人类水平,再到显著超越人类,小马智行的AI能力在2026年有了新的突破。而随着AI表现已显著超越人类司机,小马智行世界模型2.0已经具备自我诊断、自我进化的核心能力。

打开网易新闻 查看精彩图片

据悉,世界模型2.0通过自主识别驾驶过程中的弱势场景或精度需求,能够自动触发迭代优化,或精准引导人类采集高价值数据。在数据选择上,远超人类驾驶水平的AI司机数据比人类驾驶数据更具价值,因为它能更精准地模拟交通参与者与AI司机之间的交互,从而提升世界模型精度。

这构筑起一套“数据闭环”的精度飞轮:大规模商业运营产生高价值数据 → 世界模型提升精度 → 车端模型增强 → 支撑更大规模无人车队部署 → 产生更多高精度数据。这是一道结构性护城河:只有在真实世界中大规模运营 L4 无人车队的公司,才能持续产出这种高价值数据,让世界模型可以高效率提升精度。

在AI能力提升的同时,小马智行不但没有放松安全冗余,还进一步提出了更高标准的安全冗余。

楼天城认为:“全系统故障可运行(Fail Operational)应成为L4级自动驾驶行业的通用标准。”故障可运行确保车辆在遭遇突发软硬件故障时,仍能凭借计算平台、传感器、底盘通信等软硬件全冗余设计维持行驶,并择机在安全位置靠边停车,规避失控碰撞及车道内阻塞或追尾的风险。这种从算法决策到物理系统容错的全方位安全设计,保障了无人驾驶的大规模商业化运行。

在AI能力和安全冗余进一步提升的基础上,小马智行还进一步降低了硬件成本。

在2026年北京车展媒体上,小马智行宣布2027版全无人Robotaxi整车总成本下探至23万元以内,并正式发布全球首款全车规、全冗余L4级无人驾驶轻卡。同时依托世界模型2.0技术基座,小马智行将以标杆级L4级产品方案打通城市出行、配送与干线物流的全场景链条,实现人与物的高效流动,全方位重塑万亿级自动驾驶产业生态。

打开网易新闻 查看精彩图片

对于AI能力的发展趋势以及小马智行的发展规划,楼天城接受了亿欧汽车等媒体的采访,以下为对话实录,在不改变原意的基础上有所删改:

媒体:关于世界模型,有没有一个够用的精度,或者说是不是和真实世界越接近越好?第二个问题是它有没有什么限制?

楼天城:首先是世界模型精度,它最直接的表现就是它训练出来的AI司机表现的好坏,其实就是形容他精度的标准,它的本质确实是跟世界越接近越好。但是这个接近不光是极端场景能够跟真实世界一样,更多的是概率分布,就是一件事情出现的概率要和真实世界很接近,还有大家的交互。开车是一个交互行为,互相之间挤一下车这种行为也要和真实世界很接近,这个我们叫精度高,是一个非常全面的定义。这是为什么人有的时候慢慢对精度到底高不高失去判断力了,这也是今天2.0的核心。

其实2.0的本质是说这个世界模型精度有一些不太好的地方,人有的时候判断不出来,但是AI可以做准确的判断。比如说你的世界模型里其他车变道都太激进了,你应该稍微收一点,它能做出这样的判断,这是2.0日常工作的一部分,就是它自我判断出哪里不好,然后改进。

另一方面,它的限制其实也很明显,比如说他说我要收集一下这个版本路上的情况,这件事情必须要人来做,因为它自己没有办法拥有这个车,不掌握车钥匙,我拿着车钥匙,我要帮他做好这些测试,包括收集反馈的过程,他自己并没有办法完全完成,他是在人的辅助之下,比如说他会说我要这么做,但是这些工作需要人来完成,我通过这个动作把这件事情做好。这里其实也是一个一开始对我有冲击,但我已经接受很久了,各位可能还会有冲击的一个点,我们很多研发的关键部分是AI驱动的,他给我安排任务。当然这个更多只是在研发上,今天我说什么不是他安排的,都是我自己想的。

因为它需要人的帮助,在人的帮助下能够非常接近的解决各种case,让case跟实际情况完全一样。它的上限至少我还没有完全看到,它的上限是非常高的。

媒体:世界模型发完之后,我们发表了很长的一篇文章,我也认真学习了一下,我有两个问题。第一个问题,咱们在车的模型上是加了一个意图层的东西,这个意图层我看到有一些其他的个别车企也有类似的做法,但是他们的做法是往这个架构里加了一个影式的世界模型放进去,这个有可能就是结构压缩的一个世界模型放在车端,然后去做这样的一个类似于预测的判断,也就是所谓的意图层。我想在架构方面咱们是怎么做到的。

第二个问题,我比较好奇,可以看到除了小马智行之外,还有一些友商做Robotaxi L4的,他们正在向L2去做一些动作,比如说提供一些解决方案。咱们这一块有没有去做一些相应的动作或者是布局,因为我们一直没有说过这方面的事情。

楼天城:非常感谢,首先我解释一下意图层这件事情。意图层指的是训练过程当中的意图层,而不是开车过程当中的意图层,开车过程当中有在线强化学习,这也是新的技术,但是这个各家都会用一些,不是我们宣传的主要内容,简单来说是有的,但是亮点不在里。

我们的意图层是一个生成型的意图,因为在某些场景上,有很多其他的车甚至是其他的人,我先强制说这些人、这些车是什么意图,然后开始开。在这个场景当中,我可以穷举所有其他物体的意图组合,让车在所有组合当中一个判断,这个是我们世界模型做意图层的关键。

这个好处有点像多元宇宙,就是人开车的时候我会对人周围每个物体的意图做一个判断。但是其实我们自动驾驶车不是这样开的,而是对所有的意图组合做一个综合评价,然后判断怎么开。他脑子里会做左右的组合,然后看哪些组合是我需要小心的,然后它去开,这也是它开的比人安全的另外一个表示。

但是有一点,这个意图必须要在虚拟世界生成,因为我可以先生成意图,然后反向说这个意图下其他车要怎么开。

媒体:这个意图是在训练层,如果说落到车端的执行层,中间会有很大的延迟,这个怎么去解决?

楼天城:车在执行的时候只有车辆模型,它会以在他训练时的方式,估计一个其他车意图的分布,然后它做一个它的判断。因为它在训练的时候也是这样的,因为训练的时候也不会告诉它说是哪一个意图,它也是根据意图分布做一个判断,其实两者是一样的状态。

我们觉得开车中的意图是更核心的层面,人开车是通过意图来决定怎么开的,这个大家都有开车习惯,都会了解这一点。比如说相比语言,语言并不是开车当中很核心的东西。我相信很多年以后再看,如果真能留下一个layer,肯定留下的是意图层而不是语言。因为人开车的时候不会想着语言的,这也是意图的一个点。非常感谢您提到意图层这个点,意图其实是一个多元宇宙的概念。

媒体:去年开始,大家在车端的算力上有分歧,有一种是把稍微大一点的模型放在车端上,用一个几千TOPS的算力芯片。还有一种是反过来,用一个参数小一点的模型,用云端的算力芯片。我们怎么来看待这一点,我们现在车端的算力其实也不小。

楼天城:首先我先抛开L4和L2的差别,我先说一下模型,自动驾驶本身来说,如果说模型大小差3-5倍,其实完全可以通过最顶尖的蒸馏技术想办法,我能够让它基本上看不出差别。大家认为DeepSeek是一个极端,DeepSeek减少了20倍。意思是说,如果说差三五倍的算力,你是愿意把钱花在买芯片上还是愿意花在蒸馏上的考虑,就是你是选择多招一些工程师大家把模型蒸馏好,还是说索性把钱省下来去买芯片,是这样一个选择。

如果说真有100倍的差别,那肯定是有区别的,因为蒸馏没有办法蒸100倍。如果说算力能差100倍有本质差别,但是三五倍的话,就是钱花在哪里的区别这个在各个领域都是如此,希望这个能回答你的问题,也许跟你想的不一样,但是事实就是如此,就是钱放在哪个地方的问题。

媒体:有一些Robotaxi的用户反馈,比如说在高峰时段,Robotaxi的效率相对低一些。您认为这是一个技术问题还是什么问题?

楼天城:这正是我们过去半年、一年主要提升的方面。在上个季度财报的时候我们也说过,比如说我们在广州、深圳已经达到了单车盈利模型转正,这个最关键的就是能在高峰期、市中心让大家满意我们的车,就愿意打我们的车。其实车的满意度是非常关键的,因为满意度直接影响到单量,大家愿不愿意打这个车,这是我们最近提升的最重要的几个方向。

简单来说,这确实是一个需要技术攻克的点。最终通行效率这件事情不可能说像安全那样比人高很多,只是说大家达到差不多的状态,甚至有的时候稍微差一点的状态,这是因为有一个因素。正常路上的人,对无人车和有人车之间是存在双标的,他更不愿意接受无人车犯错误。这个时候总要稍微谨慎一点,但是这个谨慎可能会影响到你的效率。就是同样这样开,人开可以的,但是自动驾驶他会骂你的。所以会稍微差一点,但是不会差到让大家不满意。这也是大家都说我能做自动驾驶,我有几辆车,我能运营,但是这个差别到商业上就是巨大的差别。

媒体:物理AI跟汽车的虚拟模型,或者说他们两个的世界模型同样去做物理世界赋能的时候,有什么关键性的区别和差异?

楼天城:我猜想你问的问题是物理AI和自动驾驶的差别。物理AI就是训练具身的环境。具身今天很多应用还在早期,大家看到很多机器人还在DEMO状态,如果说有一天走到应用的时候,具身也需要一个物理世界模型做训练,也会走到这一天的。你可以认为自动驾驶是一个最早期的具身应用,他更早的走到应用世界模型的状态。但是具身的世界模型需要更多的物理定律。大家知道自动驾驶只要车不撞就可以,我根本不用管太多撞了怎么样。但是具身中的物理接触是更多的,而且它是明显有多维度,这个维度指的是除了视觉之外,还会有听觉以及其他的感觉,所以它需要更长的时间,这也符合现在具身发展的阶段。

媒体:英伟达年初开源了一个世界模型,有一些人直接就说没有用,您有什么看法?

楼天城:世界模型也是不同的意思,世界模型也分为以生成为主的,以交互训练为主和物理世界为主的,英伟达是生成为主的世界模型,而我们应用是用于训练,所以我们不会直接买来用,但是有其他用于生成的人还是很有用的,还是因为它有不同的用途,它不是我们这一支的用途。

媒体:关于Robotaxi,今年我们看到越来越多了车企,尤其是L2的厂商现在都开始在谈,这个会影响到小马的全球化,你们会不会在量产上加快?是不是会有更多量产车出来?

楼天城:首先我们拥有多款车型也是我们平台的优势,我们同一款方案可以放在多个车型之上,大家知道Robotaxi也有一些本地的特点,比如说本地更想打本地的车,这也有这方面的考虑,是我们主要的点。

关于量这件事情,确实现在有很多玩家开始进入Robotaxi市场,但是另一方面也看到,大家的技术路线,大家都在提基于世界模型的强化学习,相信各位听过很多这样的消息。其实从路径上来说,大家也都走的传统Robotaxi公司相同的路径,换句话说,至少L2很多已有的积累,在他L4上没有提供任何帮助。比如说L2说我有更多真实数据,其实大家都在真正按照L4的发展走这条路,换句话说不做L4的公司也可以走这条路。

另外一个维度,在今天L4当中,车的驾驶能力,AI能力,安全性是真正影响它能不能铺开的关键,造车的能力我不是说它很容易,这个Knowhow相对是一个更广的范围,所以我认为造车本身是可以通过合作来做到的,造车本身并不是影响你车队规模能做多大的关键因素。

媒体:它的关键因素是什么?

楼天城:车的AI驾驶能力和它的安全性,才能决定有没有能力上很多的车,而提升安全驾驶能力需要走的是L4整个强化学习或者是世界模型这条道路。大家都愿意走,说明这个行业得到了很多关注,另一方面,所有玩家已有的积累帮不到走这条路,所以大家要按照这条路慢慢走下去,这是我们看到的趋势。就是说他没有任何道理比L4从0做到1000少任何一个步骤,任何一家L4公司从0走到1000,要走过的所有步骤,L2公司也都得走一遍。

媒体:我有两个小问题想问一下,您怎么看现在小鹏也开始做Robotaxi,以及Robotaxi这个赛道现在小马已经看到了盈亏平衡点,但是我们还没有在这个领域找到很可靠的商业化轨道,您怎么看待这个领域未来的趋势以及什么时候Robotaxi能够走进我们日常?

楼天城:其实这也是Robotaxi最有意义的特点,比如说它跟传统的APP,跟ChatGPT最大的不同,大家的体验需要物理接触体验。我跟你说这个APP很好用,去聊聊天,你打开一个网页就可以看了。但是我说这台车开得怎么样,你需要真正体验一下,这是所有物理世界应用的特性,这个并不会因为自动驾驶而特殊,所有物理世界都有这个特性。

它带来的特点其实您提到了,它占领用户心智需要非常长的时间,不是说一铺开所有人都开使用了,所以我们为什么要一个个城市去铺,一步一步去接触用户,是这个过程。还有一个好处,后来者如果想要去进入也需要这个过程,他没有办法像互联网那样,一夜之间传播到所有人。这是物理AI应用的特色,需要更长的时间,达到更大的规模,优点是它一旦达到了,它的护城河会更强,这其实也是它的一个特点。

我们说的都是Robotaxi,都是指无人的,究竟有没有本事做到几百辆、几千辆,不是说你能不能生产出1000辆车,根本还是说你的车安全性够不够,你放这么多车路上不会出事故,不会被人骂,这才是关键。

媒体:我的问题是现在技术路线好像都是向世界模型强化学习去收敛,有很多家车企都表示他们是通过同一个架构由L2进化到L4,在这个阶段您还认为从底层技术来说L2和L4是不同的物种吗?

楼天城:刚刚我的解释是从产品角度来说的,就是L2和L4在产品上有区别,L2做的好了之后会出问题。下面我从技术上来说这两者之间的差别。

技术上,只要关注一点,L2其实技术上大家经常脑子中想的给L4的帮助,进化的说法更多是指数据,就是说我车能采集很多数据来帮助L4。但是其实问题也很明显,L4到后期的数据是靠虚拟数据,靠合成数据。而在这个状态下,过度依赖真实数据甚至是负面的。这导致L2积累的最关键优势帮不到L4真实的进展。如果说你要做L4,也是要按照L4的方式,比如说做世界模型,做强化学习全部走过一遍,这个任何一家公司做并没有明显的差别。

我是从这个角度来说,我不是说L2公司进不到L4,而是说这个路线本身。

媒体:小马智行成立业有10年了,您觉得10年间自动驾驶行业最大的认知纠偏是什么?

楼天城:我觉得可能就是世界模型这件事。我们是2020年开始做的世界模型,我们最早对外宣传是到了2024年,因为之前几年大家在疫情中,我们就没有说那么多。应该说在我刚说的时候,很多人会觉得我是一个另类,大家都是用采集真实数据来做模仿的,什么时候不用模仿开始用仿真了,开始用模仿学习,开始用自学的方式了。但是今天已经没有人这么说了,今天所有人都在说世界模型。其实这也是更多行业外的同事愿意接受的过程,这也给了他很大的帮助。

但是这个对人冲击是很大的,你需要接受一个事情,就是你作为一个老师教学生,教着教着学生比你强了,你就不要再下手教了,最好给学生创造环境,创造条件让学生自己变好。这种对人有的时候是有冲击的。但是这个行业很好,大家都接受了这种冲击,意识到人的不足,意识到了人跟AI的配合应该怎么做。

这里我也有点感慨,AI刚刚出现的时候有一个图灵测试很著名,图灵测试是什么意思?就是说我一个人坐在中间,左右两个,一个是AI,一个是人,我能不能区别哪一个是人,哪一个是AI。图灵测试的意识是AI要像人,但是我反问,如果说AI超越人了,图灵测试是应该能够区分AI和人的,因为好的那个是AI,差的是人。这么多年,大家大家并没有接受AI很多方面能超过人,没有想到自动驾驶过去10年,很多人接受了这件事情,这个还是非常感激,大家非常开放的心态。图灵测试今天是失效的,因为好的是AI,差的是人,这个可能可以回答你的问题。

媒体:那就不能反过来吗?

楼天城:人可以反过来判断,就是说话突然之间会脑抽的是人,一直很有逻辑的是AI。今天大家跟聊天工具聊就会有感受,我问你一个什么问题,还不如问AI工具,这个现象很明显。

媒体:了解到像今年很多无人驾驶公司会推出一些无人前装量车的车,今年我们也发布了全车规、全冗余L4级无人驾驶轻卡。咱们是怎么做到这一点的,其中的难点是什么?

楼天城:从根本点来说,我们意识到了轻卡和Robotaxi之间的相同之处。大家知道轻卡是2-5吨的,不是非常小的那个车。它实际运营的场景都是正常道路,从集散地到集散地的道路,这个道路和路上打车是非常接近的,大家走的是一样的路,一样的要求,一样的车,一样下雨,所有的问题都是一样的。应该说这是我们找到的Robotaxi这个技术场景最好的延伸方向。它的难点和关键点和Robotaxi是一样的。

至于说车规和冗余这件事情,是因为我们从Robotaxi的经验知道,这台车既然在路上跑,大家对它的安全要求肯定是很高的,应做的事情都需要做到。所以我们决定一步到位。我们没有说一步一步,先做没有冗余的,先试错。我们就想按照它应有的安全标准设计这款车。所以它是最好的沿袭小马智行已有的优势,做的直接的商业拓展,主要是从这方面考虑。

媒体:关于物流车,今天我们发布的轻卡,包括京东也在做24方的无人车,是没有车头的。咱们为什么做这样的设计,咱们准备怎么去做轻卡的无人驾驶?

楼天城:提到无人物流车,我还是从监管说起,今天对物流车现在也有更标准化的监管出来了,最近也出台了对物流车的监管,对什么样的人能上什么样的道路,有了更加明确的规定。你看物流行业,特别是城际的物流,其实能够上一定的快速路是非常重要的,不是通过羊肠小道过不去的,他是一路上40、60、80的时速在跑的,这种情况下,我们要的是一辆能够很好的车,它是一辆正常人能开的车。这说明它在各方面的稳定性、安全验证是通过标准的。

所以我们希望从有车规或者说标准的方式来进入这个市场。而且我们也相信随着监管以后变得越来越严格或者是越来越标准化之后,我们能够开上这样道路的车,在整个运输中应该能够有更大的发挥空间。

媒体:为什么没有做更小的车?

楼天城:我们认为轻卡是最大的市场,我们也做过统计不同车型的数量,这个车其实是市场上运载量最大的,而且明显比第二大很多。可能唯一能跟它比的就是卡车和Robotaxi。

媒体:我们看到最近两年Robovan自动驾驶很火,小马智行城配为什么是现在,是因为看到市场机会成熟了,还是因为L4技术的溢出。包括之前也了解到,做重卡的时候跟Robotaxi有一些能力的复用,大概有70%,现在做轻卡有没有一些特殊的技术问题需要去解决。最后我个人有一个疑惑,小马智行新一代Robotaxi是用4颗Orin来等效1000TOPS的算力,现在有的Robotaxi是用单颗的Thor-X等效1000TOPS,这个我们会不会跟他们生产生一些差距,为什么?

楼天城:第一个问题很简单,我们的Robotaxi、Robotruck技术上有80%左右的共享。自动驾驶物流覆盖的只会更高,甚至我敢说,绝大部分真正最难的部分都是共享的。最难是什么呢?路上有一些极端情况,突然的加塞,跟一些人的博弈,一些非常危险状态的发生,这些都是共享的。这个跟我是一个轿车,还是一个大货车并没有本质区别,最难的部分是共享的。正是我们看到技术上的空间,所以我们这样做了。

另外从商业上也有更多人开始相信这个故事了,在两年前很多很多人没有怎么相信这个故事,或者说相信它能带来效率提升,这也是双方互相推动共同存在的过程。

关于算力芯片的问题,其实非常简单,因为我们需要有冗余系统,如果说它真的是单颗的Thor,我会怀疑它是不是完整的系统。自动驾驶是需要冗余系统的,我们是分成两组的,其实不是“2+2”而是“3+1”,有一颗Orin专门的任务是做冗余。它的任务是在元件失效的时候能保证基本安全,这个基本安全是比如说能够穿过危险区域靠边停车的过程。所以系统上本身的独立是很重要的,如果说是一颗Thor,整个芯片出问题,那他就没有办法做了。如果说真的是一颗Thor-X的话,那是另外一回事。但如果说它是一颗Thor加上一颗Orin,只是没有说Orin,这样可以。但是如果说大家懂技术的话,不会这样做的,我也没有听说过任何一家能用一颗Thor加一颗Orin,这个技术有点深。

媒体:我想表达的是大家都是1000TOPS,但是我们是四颗独立芯片,他们是一整颗芯片,芯片之间的通讯会不会受影响?

楼天城:这个很多工作能做好的话,能够弥补这个缺陷。但是对方也不可能是一颗Thor,至少是两颗Thor,但是如果说是两颗Thor的话,那成本就非常高了。

媒体:我感觉小马一直在强调的是云端的世界模型训练环境,从第一代到第二代,我不知道是不是对你们来讲,车端是什么架构,什么方案没有那么重要?

楼天城:首先我相信车端各家都是已经是端到端的状态了,不是端到端的话,也不好意思说自己是L4了。单从highlevel的不同其实已经不太明显了,所以更多的不同点是在训练范式1.0和开发范式2.0,这是主要的差别,所以我更多把重点放在能体现出差别的地方。

说到车端的问题,刚刚讲到的意图也是车端的一个特色,但是它也是因为训练范式1.0不同给到它的一个优势。回答你的问题,如果说车端的话,单从highlevel,其实大家基本都已经是端到端的状态了。

媒体:这个端到端是CNN的还是Transformer的?

楼天城:肯定早就以Transformer为主了。但是它的很多训练的决定是由模型决定的,这个结构很多东西需要人去确认,但是它的很多优化部分是靠模型来做的。这个叫模型训练模型,我先整一个世界模型它来训练,这个里面的很多结构是AI参与决定的,所以并不是人来做的。但是简单来说,肯定不可能是在CNN,而是偏Transformer为主。

看得出你关心这个方面,但是这个在L4领域,好几年前就是这个状态了。

媒体:但是圈内也有人把车端的模型叫做世界模型,这个怎么理解?

楼天城:我觉得是误解。或者说有一种在线的做法,但是这个做法严格来说那个东西算不算世界模型,你可以硬那么叫,但是里面更是一个Smart Agent的表现。因为世界模型除了Smart Agent交互之外还有评价,但是评价本身很难想象会在车端,这是很奇怪的。

媒体:小马推出世界模型构建精度飞轮,目前咱们世界模型的能力边界在哪里?会对咱们未来的路线选择会有什么影响?

楼天城:技术路线本身就是拿一个模型来开发,这件事情已经是接下来的技术路线了,而且这件事情不仅出现在自动驾驶领域,这个叫Agent,现在很多领域用一些Agent去做研发这件事情已经存在了,所以用Agent去做研发就是自动驾驶接下来更常见的技术路线了。

但是能力边界这件事,至少它证明了它超过了由人来研发能达到的上限,但是它自己上限是什么,现在AI还没有办法回答这个问题,我也只能问它。如果说有一天它能做到虚拟世界和真实世界非常接近,它利用所有AI的能力做训练,但是究竟它能超越人类多少这件事情,特别是在复杂场景,比人类高出很多这是一定能做到的,但是上限在那里其实是AI回答的问题。

媒体:您认为下一步发展是什么,从AI开车到现在AI评估开车,您认为下一步会是AI来干什么?

楼天城:两个方向,第一是物理,物理很多AI还没有被攻克,真正理解物理世界的很多东西,今天我不知道AI能不能在短时间内做成这件事,这个甚至有机会我也愿意contribute,就是通过AI的方式理解物理世界究竟是如何运作的,这是很有挑战的一件事。

还有一个,AI已经从训练模型开始驱动研发了,接下来是不是能够run一个更大的团队或者是run一个公司,由AI来制定策略。再往后它可以做一个社区。从AI发展角度来说,有一个另外一个分级标准,这个Agent是说开始是辅助人类完成工作,到独立完成事情,到能够自主创新,其实今天AI已经有自主创新能力了,下一个就是能不能运行Community的问题,它开始拥有社会性能力,这是AI发挥的趋势。如果说大家会担心人类有一天要学会AI共存这件事情,其实是在那个阶段,人确实需要思考人和AI是什么关系。

媒体:其实在前一段间卓驭和元戎都说有可能自动驾驶这个行业面临着大模型公司的降维打击,或者说他们可能会杀进来,带来不一样的打法,您怎么看待这个问题?

楼天城:大模型公司如果你指的是OpenAI这种大模型公司的话,这个东西的标准叫法叫基础模型,英文就没有大模型这个词,只有基础模型这个词。其实它们都是自动驾驶公司进步的基础,大家是一个合作关系。但是另外一个维度,真正做到自动驾驶不是说只要有一个模型就够了。首先基础模型本身就是Token之间的成语接龙,基于这个成语接龙的基础模型我们会做很多后面的工作,比如说要做Agent,Agent做出产品,硬件的适配,运营的很多东西,其实是基于他们的工作做了很多的东西,所以大家是合作的关系。

就算你有一个非常完美的基础模型,后面这些工作也都需要做。简单来说,如果说只是一个模型,甚至任何新玩家进入这个市场影响都不是很大,或者说进入门槛一样会很高。但是如果你说基础模型越来越好,确实会帮助到其他公司的进步,这个我们也得到了好处,所以大家更多是合作的关系。自动驾驶不只是一个模型而是一整套的东西。