数年投入20亿元研发。
出品丨自主可控新鲜事
本文内容来源于曦望、芯东西等
正文共1237,建议阅读时间2分钟
今日,浙江杭州国产GPU芯片公司曦望(Sunrise)正式宣布,一年内已完成近30亿元融资,将用于下一代推理GPU研发、规模化量产及生态共建。
该公司汇聚了三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,并获得诚通混改基金等国资背景资本加持。
曦望成立于2020年,前身是商汤科技大芯片部门,目前团队约300人,主要来自于NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验。
曦望联席CEO王勇是前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,2020年加入商汤后,带领百人团队成功主导了曦望两代芯片的研发和量产。
另一位联席CEO王湛则是百度创始团队成员、原集团副总裁,曾带领百度搜索8000人团队,2025年初加入曦望,负责公司产品化和商业化。
王湛称,曦望的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取。
据悉,曦望选择了差异化的技术路径,摒弃了传统训推一体GPU为训练优化的设计思路,聚焦推理场景进行原生架构重构——在调度、缓存、片上SRAM、互联及编译器路径上做深度优化,结合LPDDR内存技术,从根源降低单位Token推理成本。
同时,该公司全栈自研指令集、GPGPU IP及编译工具链,手握200余项核心专利,具备百人团队“一次流片成功”的经历。
公开信息显示,曦望数年投入20亿元研发,已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求。
其2026年即将推出的S3芯片,主打高推理性价比,在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准。
之前,曦望在2020年量产的S1视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户。
2024年量产的S2芯片,对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型。
在曦望看来,对算力厂商、AI原生应用开发者而言,推理能效、SLA稳定性与Token成本,才是决定业务毛利率与用户体验的核心指标。
因此,曦望选择聚焦真实场景的单位经济性,成为现有算力系统的 “推理分流与成本优化层”,与本土芯片厂商合作为客户构建推理加速专区,形成独特的竞争生态。
免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。
点击下方标题,洞悉信创产业发展
热门跟贴