马斯克最新访谈谈到:2026年实现AGI,奇点降临。甚到有媒体解读到:“留给旧世界的时间只剩2000天”。马斯克说,到 2030 年,人工智能将超过所有人类智能的总和。在3 到 4 年内,Optimus 机器人在精密手术方面的表现将超越人类医生。机器人拥有共享记忆、极限精度,且不受情绪干扰。马斯克认为,虽然未来 3 到 7 年的过渡期会充满动荡和不安,但技术将最终消除物质匮乏、彻底改变医疗与能源,并将人类带入一个以智能和丰饶为底色的全新时代。
2026年第一个月AI又开始加速:特斯拉、谷歌们要慌了……
特斯拉们,慌了?英伟达智能驾驶实测曝光:仅用一年追平马斯克八年心血
GPT-5.2连肝7天,300万行代码造出Chrome级浏览器
特斯拉们,慌了?英伟达智能驾驶实测曝光:
仅用一年追平马斯克八年心血
来源:新智元
【导读】 英伟达汽车业务虽仅占总收入1%,但十年积累已成气候。与Uber合作、推广L2级城市功能,到2028年实现L3高速公路驾驶,英伟达只用1年几乎完全追上了马斯克的FSD。
旧金山,晴空万里。
记者Andrew J.Hawkins坐进了一辆奔驰CLA的副驾驶。
驾驶座上的安全员卢卡斯双手虽然虚握着方向盘,但显然只是为了合规——车辆完全在自主思考。
在近40分钟的体验中,没有发生任何碰撞事故,甚至几乎没有任何顿挫。
结束后,Hawkins不禁发出了一声感叹:英伟达的自动驾驶即将起飞,特斯拉真的该着急了。
这或许会让马斯克脊背发凉:英伟达仅用1年时间就实现了城市自动驾驶功能,而特斯拉为此花费了整整8年。
比FSD更安全?
英伟达联手奔驰首秀智能驾驶
这辆测试车搭载了英伟达全新的点对点L2++级辅助驾驶系统。
旧金山的街道,如往日一般繁忙和混乱。
在测试中,车辆需要避让送货卡车、穿行的骑行者、行人,甚至还要与Waymo的无人出租车「比赛」。
在英伟达AI系统与车辆自带摄像头、雷达的配合下,这辆奔驰从从容容、游刃有余:无论是复杂的四向停车路口、双排违停的车辆,还是偶尔的无保护左转,都难不倒它。
最令人印象深刻的一幕是:为了绕过一辆挡路的卡车,系统主动发起了一个大角度右转,但在执行动作前,它非常绅士地礼让了几位缓慢过马路的行人。
特斯拉粉丝可能会对英伟达的演示嗤之以鼻,认为马斯克花了8年时间打造的「FSD」遥遥领先,能力要高出几个数量级。
的确,并不是所有智能驾驶都叫「FSD」(完全自动驾驶)。
不过,从实际体验来看,英伟达在最复杂路况下的表现,绝对有实力与特斯拉一较高下。
而且奔驰车辆的雷达提供了冗余感知能力,有人甚至会说这套系统比纯视觉方案的FSD更安全、更稳健。
但也大可不必把两家公司视为仇寇。
毕竟,特斯拉是英伟达最重要的客户之一,其AI模型训练依赖着数万颗英伟达GPU,这代表着价值数十亿美元的人工智能基础设施投入。
因此,即使最终特斯拉获胜,从某种意义上看,英伟达同样是赢家。
英伟达:在汽车领域十年的投入
英伟达的智能驾驶系统,让人颇感意外。
毕竟,它并非公认的自动驾驶领头羊。
尽管英伟达长期以来一直为各大汽车制造商提供用于辅助驾驶系统的芯片和软件,但与其在 AI 领域狂揽的数十亿美元相比,其汽车业务的规模仍微不足道。
英伟达汽车部门负责人吴新宙表示,自2015年以来,英伟达以Drive品牌为汽车提供芯片和其他技术,但这仍是公司业务中的一小部分。
截至2025年10月,汽车和机器人芯片仅占5.92亿美元销售额,约占英伟达总收入的1%。
英伟达正在打造汽车科技业务。图为2023年6月5日,公司位于加利福尼亚圣克拉拉汽车维修厂的自动驾驶测试车
在过去十多年里,英伟达已投入数十亿美元打造一套全栈式解决方案,涵盖系统级芯片(SoC)、操作系统、软件和硅片技术。
这其中就包括英伟达的Drive AGX系统级芯片(SoC),该系统基于Blackwell GPU架构,据称每秒可执行1000万亿次高性能计算操作(TOPS),类似于特斯拉的「完全自动驾驶」芯片或英特尔旗下Mobileye的EyeQ芯片。
英伟达将这些供应商提供的传感器融合成一个无缝生态系统,涵盖摄像头、雷达、激光雷达和超声波技术。
它还通过低延迟互连实现了制动、悬挂和转向的跨域控制。
吴新宙对媒体说:「黄仁勋总是说,我和我团队的使命实际上就是让一切移动的物体都实现自主化。」
物理AI的ChatGPT时刻
最近,首款基于英伟达自驾系统的奔驰CLA,获得了五星级欧洲NCAP安全评级,Nvidia驱动的主动安全功能为这一成绩做出了贡献。
在CES 2026上,英伟达发布了Alpamayo,专为应对自动驾驶长尾难题而设计,首次将视觉-语言-行动(VLA)人工智能引入量产车。
Alpamayo系列还包括用于自动驾驶开发的仿真工具与数据集。
Alpamayo 1、AlpaSim和Physical AI开放数据集,能够助力开发具备人类判断力、可感知、推理和行动的车辆——使开发者能够微调、提炼和测试模型,从而解锁更高的安全性、鲁棒性和可扩展性。
Alpamayo系列引入了基于链式思维推理的视觉语言动作模型,将类人思维带入自动驾驶决策过程。
这些系统能够逐步思考新颖或罕见场景,从而提升驾驶能力和可解释性。
这对于在智能汽车中建立可扩展的信任与安全至关重要。
英伟达创始人兼首席执行官黄仁勋表示:
物理AI的「ChatGPT时刻」已经到来——机器开始理解、推理并在现实世界中行动。
他认为:「自动驾驶出租车是最先受益的领域之一。Alpamayo为自动驾驶汽车带来了推理能力,使它们能够仔细思考罕见场景,在复杂环境中安全驾驶,并解释其驾驶决策——这是实现安全、可扩展自动驾驶的基础。」
英伟达在自动驾驶上的野心
2025年10月,英伟达与Uber建立自动驾驶出租车合作关系,并准备于2026年向更多汽车制造商推广。类似Waymo无人驾驶出租车的「小规模」L4试验也计划在2026年展开,随后将于2027年通过与合作伙伴部署机器人出租车服务。
英伟达汽车部门负责人吴新宙介绍:
2026年上半年推出L2级高速与城市驾驶功能,包括自动变道、识别停车标志和交通信号灯等。
到下半年,英伟达计划将城市驾驶能力扩展至自动泊车。
到2026年底,英伟达的L2++自动驾驶系统预计将覆盖整个美国。
对于L2和L3级车辆,英伟达计划使用基于Drive AGX Orin的SoC;而对于真正的L4级全自动驾驶车辆,则会转向新一代的Thor芯片。
在2026年开展「小规模」L4级道路测试(类似Waymo的自动驾驶出租车)。
他还分享了更远的计划:
在2027年与合作伙伴共同推进Robotaxi部署。
到2028年,英伟达计划提供支持L3级高速公路驾驶的系统,允许驾驶员在特定条件下放开方向盘并移开视线。
黄仁勋选择了与马斯克不一样的路线
在1月5号拉斯维加斯CES大会的发布会,英伟达表示汽车制造商可以使用其每颗约 3500 美元的 Drive AGX Thor 汽车电脑,节省研发成本,并更快地将自动驾驶功能推向市场
与特斯拉试图追求完全的自动驾驶不同,英伟达提供的方案中,允许驾驶员放开双手驾驶的最终决定权掌握在整车厂(OEM)手中。
英伟达还将他们与汽车制造商合作,对自动驾驶功能进行个性化的定制需求,使车企可以设定诸如加减速、变道时机和驾驶风格等参数。
这种灵活性使每个车企都能展现自己独特的「驾驶个性」,比如让系统开起来像一辆奔驰,而不是千篇一律的「通用型」自动驾驶。
比如奔驰就采用了一种名为「协同转向(cooperative steering)」的机制,允许驾驶员在不退出L2辅助驾驶系统的情况下进行细微的转向调整,比如在遇到系统未识别为障碍物的坑洼路面时手动微调方向。
驾驶员也可以通过轻踩油门来启动车辆或略微提速,同样无需关闭辅助系统。
与马斯克FSD试图追求完全的自动驾驶不同,英伟达并不是要为所有人解决驾驶问题。他们的目标是「可用性」:想用这套部分自动化系统的人可以使用,不想用的人也可以轻松选择退出。
同时,英伟达的这套系统基于强化学习,意味着它会随着经验积累持续改进。
长途城市路况的对比测试中,英伟达系统的驾驶员干预次数与FSD已经不相上下,而这只花了一年的时间,要知道实现这一目标,英伟达可不像特斯拉花了8年时间,分析的数十亿行驶里程。
在未来几个月内,奔驰开始搭载该技术,而这会让特斯拉声称的在自动驾驶领域领先地位变得摇摇欲坠。
有趣的是,机器人领域也投射出类似的血腥屠杀。特斯拉承诺打造大量机器人,但英伟达已经在为波士顿动力、卡特彼勒和 LG 电子等公司的下一代机器人提供动力。
参考资料:
https://www.theverge.com/news/852880/nvidia-autonomous-driving-demo-tesla-fsd
https://www.cnbc.com/2026/01/05/nvidia-plans-to-test-a-robotaxi-service-in-2027-in-self-driving-push.html
https://www.autoevolution.com/news/nvidia-s-autonomous-driving-and-robotics-projects-deliver-brutal-reality-check-to-tesla-263676.html
https://teslanorth.com/2026/01/05/nvidia-announces-new-self-driving-ai-to-rival-tesla-fsd/
GPT-5.2连肝7天,300万行代码造出谷歌Chrome级浏览器
来源:新智元
【导读】一个大模型持续写代码,能写多久?一小时?一天?还是像大部分AI编程工具那样,完成一个任务就结束对话?Cursor的CEO MichaelTruell决定搞一次极限压力测试!
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。
不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。
结果?
300万行代码。数千个文件。
AI完全从零构建出一个全新浏览器。
而且,还是Chrome那种浏览器。
HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。
Michael Truell轻描淡写地发了条推文:它基本能跑!简单的网页能快速且正确地渲染出来。
一个模型究竟能跑多久
传统的AI编程工具,比如Github Copilot和早期的其他IDE,都是一问一答模式。
对话长度有限,上下文有限,任务复杂度有限。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。
这已经是很大的进步,但大多数情况下,任务仍然以分钟计算,最多几小时。
AI完成一个功能,人类review,然后继续下一个任务。
但没有人尝试过让一个模型连续跑一周。
直到GPT-5.2。
Cursor团队让GPT-5.2持续运行了整整一周,不是断断续续,而是连续工作。
在这一周里,它:
写下了超过300万行代码
创建了数千个文件
执行了数万亿个token
从零构建了一个完整的浏览器渲染引擎
一个模型究竟能运行多久?
答案是:理论上,可以无限。
只要基础设施稳定,只要任务足够明确,AI就能持续工作——不眠不休,不吃不喝,7×24小时全年无休。
就像澳洲的放羊大叔的「赛博黑工」。
但实际上,不同模型的「耐力」差异巨大。
上下文窗口是第一道门槛。
早期的GPT-3.5只有4K token上下文,意味着对话稍长就会失忆。
Claude 3推出了200K上下文,GPT-4 Turbo跟进128K,Gemini 1.5 Pro更是号称支持100万token。
但上下文长度只是理论值——真正考验的是模型在长任务中能否保持一致性、专注度和执行力。
Cursor团队在实验中发现了关键差异。
在Cursor这篇官方博客中,团队在实验中发现了关键差异:
GPT-5.2能长时间自主工作,遵循指令精准,保持专注不偏离;
Claude Opus 4.5倾向尽早结束,走捷径,频繁把控制权交还给用户;
GPT-5.1-Codex虽专为编码训练,但规划能力不如GPT-5.2,所以容易中断。
用更直白的话说:Opus像个急躁的实习生,干一会就想问「这样行不行?我先交了哈」;
而GPT-5.2像个老练的高级工程师,交代清楚任务就埋头干到底。
这也是为什么Cursor官方宣称:GPT-5.2是处理长期运行任务的前沿模型。
不止浏览器。
Cursor还透露了其他正在运行的实验项目:JavaLSP、Windows 7模拟器和Excel克隆。
数据都很夸张,AI自己不停地写了55万行代码、120万行代码和160万行代码。(话说,Excel代码比Windows还多点,因吹斯汀)
多智能体系统协作
一个模型在一周内写300万行代码,注意是不停的写,没有人类干预!
这显然不是一个模型「单打独斗」,怎么做到的?
Cursor团队透露了他们的秘密武器:多智能体系统(Multi-Agent System)。
最初,他们尝试让所有Agent平等协作,通过共享文件来同步状态。结果发现:
Agent会持有锁太久,或者干脆忘记释放锁。二十个Agent的速度下降到相当于两三个Agent的有效吞吐量。
这像极了人类团队中常见的问题:会议太多、沟通成本高、责任边界不清。
最终有效的方案是分层架构:
规划者(Planners):持续探索代码库,创建任务,进行高层决策
执行者(Workers):专注于完成具体任务,不关心全局,提交后继续下一个
评审(Agent):判断每轮迭代是否合格,决定是否进入下一阶段
这几乎是人类软件公司的组织架构:产品经理/架构师负责规划,程序员负责执行,QA负责评审。
但区别在于——这是成百上千个Agent同时工作。
Cursor团队实现了上百个Agent可以在同一个代码库上协同工作数周,几乎没有代码冲突。
这意味着AI已经学会了人类团队需要多年才能磨合出的协作默契。
浏览器的「护城河」
比你想象的要深得多
如果听到「不就是个显示网页的软件吗」这种评价,所有做过浏览器内核的工程师大概都会苦笑。
在计算机科学的鄙视链里,手写浏览器内核的难度,仅次于手写一个操作系统。
为了让你对这300万行代码有个概念,我们需要看一眼谷歌的Chromium(Chrome的开源母体)。
作为人类软件工程的巅峰之一,Chromium的代码量早已突破3500万行。
它不仅仅是一个软件,本质上已经是一个「伪装成应用程序的操作系统」。
GPT-5.2挑战的究竟是什么?
首先是CSS的「混沌理论」。
网页排版从来不是简单的堆积木。
CSS标准里充满了各种历史遗留的怪癖、层叠规则(Cascade)和复杂的继承逻辑。
一位前火狐浏览器工程师曾打过比方:实现一个完美的CSS引擎,就像是在模拟一个物理法则随心所欲变化的宇宙。你改动一个父元素的属性,可能导致几千个子元素的布局瞬间崩塌。
其次是「虚拟机里的虚拟机」。
这次AI不仅写了界面,还写了一个JS虚拟机。
现代网页跑的JavaScript代码需要内存管理、垃圾回收(GC)和安全沙箱。
稍微处理不好,网页就会吃光你的内存,或者直接让黑客穿透浏览器接管电脑。
最要命的是,它选了Rust。
Rust这门语言以「绝不妥协的安全」著称,它的编译器就像一位极度神经质的考官。
人类工程师在写业务逻辑时,往往要花一半的时间和编译器「吵架」,处理借用检查(BorrowChecker)和生命周期问题。
AI不仅要懂业务,还得在几百万行代码的规模下,让这位「考官」挑不出毛病。
能在七天内把这些硬骨头啃下来,并且让它们协同工作,这已经不是简单的「写得快」了,这意味机器开始具备了顶级的架构掌控力。
当AI能够「忍受孤独」
但这则新闻真正的炸点,其实不在于浏览器本身,而在于那个「Uninterrupted」(无中断)。
这是AI进化的分水岭。
在此之前,我们熟悉的AI编程工具(比如早期的Copilot)的情况是:你写个函数头,它补全五行代码;你发个指令,它生成一个脚本。
它们的记忆是碎片化的,注意力是短暂的。
一旦任务稍微复杂一点,比如「重构这个模块」,它们往往会顾头不顾尾,改了这头坏了那头,最后还得人来擦屁股。
但这次不一样。这是一次「长时任务」的胜利。
这300万行代码分布在数千个文件里。
当AI写到第300万行时,它必须依然「记得」第1行代码里定下的架构规矩;
当渲染引擎和JS虚拟机打架时,它必须能回溯几万行代码去寻找Bug的源头。
这168个小时里,GPT-5.2肯定写出过Bug。
但它没有停下来报错等待人类投喂答案,而是自己读取错误日志,自己调试,自己重构,然后继续前行。
这种「编写-运行-修复」的自主闭环,曾经是我们人类工程师最引以为傲的护城河。
现在,这条护城河被填平了。
我们正在目睹AI从「聊天伴侣」向「数字劳工」的质变。
以前我们指挥AI做「任务」,比如「写个贪吃蛇」;
现在我们指挥AI做「项目」,比如「造个浏览器」。
沉默的螺旋
虽然这个AI版浏览器的成熟度距离Chrome还有很长的路要走,但它证明了路径的可行性。
当算力可以转化为极其复杂的工程实施能力时,软件开发的边际成本将趋近于零。
这场实验最令人震撼的,其实不是屏幕上那个渲染出的网页,而是那个在后台沉默运行了整整七天的进度条。
它不眠不休,不急不躁,以每秒数千字符的速度构建着数字世界的基石。
也许我们该重新审视「创造」的定义了。
只有当工具开始独自在深夜里解决问题时,我们才明白,它不再只是工具,而是我们的同行者。
从澳洲大叔的「赛博黑工」
到AI长时任务
用5行代码逼疯硅谷的澳洲放羊大叔,其实只做了一件事情,就是让AI不达目标不能停止。
至于Prompt.md写了什么命令,并不是重点。
就像今天Cursor CEO搞的这个极限压力测试一样,目标就是造一个Chrome、造一个Windows、开发一个Excel,只要没完成目标,AI就要一直运行下去。 回到最开始那个问题:
一个AI究竟能自己干多久?
物理上的答案是无穷。只要你有足够的算力、稳定的基础设施、清晰的任务定义,AI可以无限运行下去。
但更重要的是,这改变了软件开发的经济学。
传统软件开发的主要成本是人力和时间。
一个10人团队开发一个复杂项目,可能需要6个月到数年。每个月的人力成本可能是几十万到上百万。
现在,AI可以在一周内完成原本需要数月的工作。
成本可能只是一些token费用,Emad Mostaque(Stability AI前CEO)猜测Cursor浏览器项目可能消耗了约30亿个token。
他还有一个想法:用多少token能够重写一套Windows级别的操作系统?成本如何?
Token是越来越便宜的,就像之前的水和电,最终基于token的算力也会变得极其廉价。
于是,软件经济学就被彻底颠覆。比如,软件按照授权付费的方式恐怕要消失了。
在2026年的今天,软件开发正在经历一场基因级别的变异。
从前,代码是人类一行一行敲出来的产物。
未来,代码可能只是人类意图的自动展开:你描述你想要什么,AI就能把它变成现实。
一个模型能跑多久?
只要你需要,它就能跑下去。
参考资料:
https://x.com/mntruell/status/2011562190286045552
https://x.com/leerob/status/2011565729838166269
https://cursor.com/cn/blog/scaling-agents
为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体