近日
美团、华为“撞车”
于同日发布开源模型
有媒体认为
两个大模型同日发布
传递出一个共同的信号
中国国产算力已能支持
万亿级模型的训练
“国模国芯”深度融合
华为此次开源了
920亿参数的
openPangu-2.0-Flash模型
这是盘古大模型首次以开源形式发布
模型在华为昇腾芯片上完成训练和推理
美团此次发布的
新一代开源模型LongCat-2.0
总参数达1.6万亿
原生支持100万上下文
测试版调用量跻身全球前三
据披露
这是中国国内首个
在5万卡国产算力集群上
完成训练与推理全流程的
万亿级参数大模型
此前
业内普遍认为
中国国产算力卡难以承载前沿大模型
特别是万亿级参数大模型的
训练需求
但近半年以来
中国国产算力支持大模型训练的案例
正在密集涌现
6月初
深圳河套学院AI训练平台项目团队
联合多家研究机构与团队
依托昇腾910C的AI算力集群
完成了1.6万亿参数大模型
DeepSeek-V4-Pro的全参数后训练
科大讯飞发布星火医疗大模型V3.5
实现了基于全国产算力的
医疗多模态、长上下文能力突破
智谱上线并开源
新一代旗舰大模型GLM-5.2
昇腾、平头哥、摩尔线程等
中国国产算力平台
当天即完成“Day 0”级别推理适配
在中国国产芯片集群上实现
高吞吐、低延迟、大并发的稳定运行
美团龙猫团队表示
中国国产算力卡单卡性能
计算正确性与精度
已可满足大模型训练需求
有专家认为
LongCat-2.0的发布验证了
中国国产算力支撑大规模模型的可行性
将激励其他团队加大研发投入
加速行业技术路径多元化
中国AI企业领跑开源模型市场
近年来
中国开源大模型生态飞速增长
美国独立研究机构Interconnects AI
发布的报告显示
2024年11月至2026年1月
中、美、欧开源模型使用量占比
分别为72.7%、10.4%、16.8%
公开报道显示
中国人工智能开源大模型
全球累计下载量已突破100亿次
凭借价格低廉、性能强劲、参数定制等优势
中国开源大模型在全球AI市场中的份额
逐步扩大
OpenRouter文本模型调用榜单上
DeepSeek、小米MiMo、MiniMax
腾讯混元、智谱GLM等
中国模型占据第一梯队
在AI模型交易平台OpenRouter上
热度排名前十的模型中
有六款出自中国厂商
包括DeepSeek
以及腾讯与小米推出的大模型
阿里巴巴千问(Qwen)系列
累计下载量在今年1月突破7亿
并在AI开源社区Hugging Face
累计下载量上
超过Meta的Llama
成为全球下载量最高的
开源模型家族之一
该社区发布的
2026年春季全球开源AI生态报告显示
过去一年
该平台上41%的大模型下载量
来自中国研发的模型
中国已成为全球开源大模型
供给最活跃、增长最快的地区之一
有专家表示
得益于人才和中国国内开源普惠的优势
以及算力、电力带来的极致成本效率
中国正持续提升
开源模型的全球竞争力
撰文:朱昱晗编辑:张晨昊排版:李飞统筹:李政葳
参考:中新经纬、每日经济新闻、观察者网、腾讯科技
来源: 世界互联网大会
热门跟贴