3月20日,深圳湾体育中心,人挤人。不是演唱会,是华为中国合作伙伴大会。软通动力站C位那位穿深灰夹克的高管,话筒还没举稳,就脱口砸出俩字:“核弹。”全场静了半秒,哗一下全站起来拍照。他指的不是武器,是华为刚揭幕的Atlas 350整机——里面插着那块刚流片成功的昇腾950PR芯片。

打开网易新闻 查看精彩图片

数字一报出来:单卡算力,2.87倍于英伟达H20。不是“接近”,不是“略超”,是实打实2.87。现场有人吹口哨,有人拍大腿,还有位白发老工程师蹲在展台边,盯着散热鳍片看了三分钟,小声说:“这热设计……不像赶出来的。”

打开网易新闻 查看精彩图片

你得知道,H20啥来头?是英伟达2023年专为中国市场定制的“合规版”GPU,理论峰值算力被砍掉近六成,显存带宽缩到H100的一半。美国商务部当年签字时,以为这把锁能卡住国产AI三年。结果2026年3月第3周,华为把整套方案端上桌:芯片、内存、板卡、驱动、编译器、训练框架——全链路国产。HiBL 1.0高带宽内存用的是长鑫存储的国产颗粒,封装由通富微电在南通厂里一帧一帧调出来的。

更狠的是FP4精度支持。以前跑个70B参数模型,得塞140GB显存;现在Atlas 350上,35GB顶满。智谱AI的人告诉我,他们在深圳南山的实验室里,用三台Atlas 350训完Qwen2-VL多模态模型,只用了89天。比他们用H20集群预估周期快了整整七十天。

价格?11万元。你没看错,不到H200市价的45%。七家整机厂商——昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信——当天全开渠道上架。我朋友在宝德做售前,说上午发朋友圈晒单,下午订单排到四月底。

马斯克那边呢?3月21日,他刚在X上发TERAFAB项目渲染图:德州沙漠里一座银色巨型厂房,标语写着“Orbiting AI”。底下评论区热评第一:“所以……您这算力,什么时候能连上国内4G基站?”

黄仁勋去年在台北演讲时说过一句:“禁售H20不等于禁售AI未来。”当时没人当真。现在Atlas 350的实测数据摆在那儿,浮点吞吐、功耗比、编译延迟全贴在华为官网。没有PPT,没有概念图,就一张A4纸打印的《昇腾950PR实测白皮书》,页脚印着“2026年3月20日,深圳实机跑分”。

余承东2019年那句“没有退路就是胜利之路”,当时很多媒体写成段子。七年过去,深圳湾体育中心的LED大屏上,正实时滚动着2700家客户部署节点地图。红点密密麻麻,从喀什的边防AI哨所,到温州的五金厂质检终端,再到合肥科大讯飞语音实验室——没一个连着美国云。

你信不信?就在发布会结束当晚,上海张江一家做金融风控的创业公司,悄悄把生产环境从AWS切到了华鲲振宇的Atlas 350集群。他们没发公告,只在内部钉钉群甩了张截图:模型响应延迟从820ms降到310ms,电费单少了63%。

对吧?有时候技术真不需要喊口号。它就静静躺在机柜里,风扇转着,指示灯闪着,等你按下那个“运行”键。