昨天下午,腾讯发布混元Hy3.0 preview语言模型并开源;今天上午,DeepSeek发布V4预览版大模型,二者相隔不到24小时。
尽管两款大模型的参数尺寸差异很大,擅长能力有所区别,部署所用的芯片也不同,但发布时间几乎撞车,恰恰值得做些解读。具体分析如下:
1、先正视一个基本事实:中美大模型差距,和去年比反而更大了。这不是唱衰,是梁文锋在V4模型的技术博客里的原话:"海外厂商前沿模型仍占据智能上限",部分维度比不过Claude Opus 4.6。
其实,这话还是保守的,因为估值突破一万亿美元的Anthropic,它还有一张没亮的底牌——代号Mythos的下一代模型,因为过于强大,暂时被按住没发布。
此外,OpenAI的GPT-5.5也发布了,在和目前 Claude opus4.7相比,GPT-5.5与其至少打个平手,实力强悍。也就是说,目前公开的顶尖模型,V4 其实都和他们存在差距,至于是两个月还是五个月,就见仁见智了。
但可以确定的是,相比去年1月DeepSeek发布的V3和R1模型时相比,中美差距拉大了。
2、梁文锋的历史使命:守住安全底线,确保中国大模型不被卡脖子。虽然 V4的技术博客没有写明,但可以料定,DeepSeek预训练依然基于英伟达芯片进行,但如博客所示,推理和部署已经和华为昇腾实现了无缝对接——这也是V4 版本姗姗来迟的原因所在。
虽然梁本人在一开始并未预料到自己的历史责任,但在客观上,DeepSeek 已经被整合进 AI 国家安全的国家队,与华为昇腾进行软硬一体的适配,最终实现大模型完全自主可控。这是一个政治目标,不以个人意志为转移。
也因此,DeepSeek 的根本任务在于,守住大模型安全的底线,在极端情况下,依然可以实现自主安全可控。当然,这并不意味着 DeepSeek 不追求商业化,借助国产芯片的低价,V4 flash版本的百万token价格仅 0.2 元,足以震慑市场。
此外,近期传闻腾讯、阿里投资 DeepSeek,虽然不清楚具体情况,但在各类国资竞相入股的对照下,吸收腾讯阿里进场,显然对 DeepSeek 更有吸引力,至少可以获得更丰富的应用场景、更大的自主性。
3、姚顺雨当前锋,以重建混元为起点,剑指可落地的大模型商业生态。不管中美,AI 资本开支巨大,到目前为止都存在一个令人胆寒的问题:这么多投资,能收回来吗?
腾讯是中国市值最高的公司,且产品形态以克制著称,既没有字节那般摧城拔寨的锐气,也没有阿里那样大开大合的冲劲。
某种程度上,微信是中国数字化社会运行的底座,既然是底座,就要求AI 转型国产尽可能丝滑平稳,姚顺雨领导下的混元团队,其目标在于为包括微信在内的公司战略级产品,提供更全面的能力和更精准的测评及适配,任务不可谓不艰巨。
姚顺雨能在短短88天重建混元,并交出不错的答卷,堪称达到了拨乱反正的效果。据一位知情人士称,姚顺雨对之前的组织架构进行了大刀阔斧的改造,其力度之大,让人瞠目。
举一个例子,一个在读博士,目前以实习生的身份领导一个关键项目,可以指挥多位高级工程师乃至资深专家,这在过去是不可想象的。当然,这样的实习生津贴也是极度可观的,据说一天的津贴就达到了 5000 元。
此外,姚顺雨打破了行政领导收入普遍高于业务专家的惯例,这就使得科学家和工程师们更加聚焦研发,而不是争资源、抢地盘。
他主张和产品经理合作,即co-design模式,以达到PC时代的安迪·比尔定律*那样的效果,让芯片水准、模型能力、操作系统、产品应用持续滚动起来,不断推动整个产业的前进。
这一做法使得混元进步乃至腾讯向AI转型变得可预期。从 Hy3.0 preview技术博客里各家产品经理的反馈来看,目前基础模型和产品业务的关系十分融洽,而这是DeepSeek、智谱、Kimi等所不具备的优势。
4、中国反超美国,其路径高度依赖大模型和商业场景的深度匹配。无论梁文锋还是姚顺雨,或者杨植麟、闫俊杰,都强调模型的实用性,因为这是中国模型反超美国模型目力所及可能的路径——这几乎成了中国高科技产业赶超的通用路径。
所以,如果以芯片国产化率的高低为横轴,以配合 AI的场景丰富度为纵轴,我们就可以看到下面这张象限图:
(图片为作者自制)
DeepSeek在右下,负责守卫底线安全;混元、豆包、千问在左上,决定商业上限;Kimi、智谱、MiniMax在左下,是比较单纯的基础模型;右上象限需要国产化强+场景丰富,目前还没有出现,未来如果国产芯片和训练生态足够强大,就有机会出现。
目前,中国高层对大模型路线的设定非常务实,一方面要确保极限情况下的模型自主可控安全,另一方面又要发展大模型的商业生态,以确保整个产业持续前行。
事实上,二者是相辅相成的,因为没有核心技术自主,就没有坚固的商业生态,反过来不发展繁荣的商业生态,就不可能实现技术自主的突破和保持。
前苏联科技发展的教训言犹在耳,由于缺乏一个商业市场,导致苏联科技变成无本之木,无源之水。中国当然不能踏入同一条河流,所以对腾讯、字节、阿里的政策宽容度很高,这是明智的。
5、低调、谦逊,但拥有坚实的自我,是梁文锋和姚顺雨的共同特点。如果你去读 V4 和 Hy3.0 preview 版本的技术博客,就会发现他们都非常谦逊,都不在意 benchmark(打榜排名),都在文中表达模型有哪些不足,期待进一步改进(不存在第一、遥遥领先等内容);
但另一方面,他们又对自己选择的技术路径高度自信,基于广阔的视野和井井有条的行动,他们向着自己的目标坚定前行。当然,除了他们,张一鸣、杨植麟等人,也都呈现出相似的这一面。
或许,这就是新一代中国科技产业领军人物的共同特点:他们视野广阔,渴望学习硅谷,但不崇拜硅谷,愿意扎根本土,用一套“稳守反击”的战术,去推动本土创新,去争取比赛的胜利。
热门跟贴