follow us

AING硬迹

打开网易新闻 查看精彩图片

让大参数模型在消费级硬件上直接运行。

近日,端侧智能基础设施公司万格智元宣布连续完成天使轮及天使+轮两轮融资,由五源资本、峰瑞资本联合参投,累计融资金额达数千万元人民币,源合资本担任独家财务顾问。

这家2025年成立的初创公司,由清华大学计算机系00后在读博士王冠博领衔,团队仅约20人,近90%为00后,核心成员来自清华、北大及字节跳动、OpenAI、亚马逊全球AI研发部门。

王冠博的主要研究方向是“端智能”,他的博士课题就是如何让AI摆脱对云端算力的依赖、跑在手机和电脑里。他累计发表了近十篇顶会顶刊论文,为阿里、美团等企业打造过个性化算法服务,在学术界和产业界之间反复穿梭。

端侧场景,消费级设备的内存天花板通常在32GB左右,实际可用于模型推理的空间往往只有8-10GB。这意味着,传统方案只能在本地部署约4B参数的“小模型”,能力严重受限。

万格智元的核心产品是一套端侧算力引擎cPilot与智能平台Amis的组合方案,其战略定位非常明确:不做端侧小模型,只做端侧大模型。cPilot是一个介于底层硬件和上层软件之间的中间层,通过自研的动态稀疏化算法等技术突破,大幅压缩模型的运行时内存占用。

万格智元构建了从算法到硬件的“技术全栈深度优化”架构,通过自研非GPU轻量化推理架构、算子优化与流式并行模块调度,将模型推理进行协同拆分与均衡,让大参数模型在消费级硬件上直接运行。

目前其技术成果可实现:在纯CPU条件下,仅需约4.7GB内存即可运行一个35B参数的模型,推理速度提升约30倍,端侧推理速度至少快了12倍,部署成本从万元级降至千元级

商业模式上,万格智元呈现“B端先行、C端跟进”的节奏。

B端层面,公司已与多家头部硬件厂商达成合作,为AI mini PC、AI PC、AI NAS等产品预装端侧算力引擎及本地部署方案,预计今年将有数万台设备预装出货,2026年预期营收超千万元。

C端层面,Amis平台提供一键部署模型、聚合API的能力,通过端云调度实现“大部分简单任务本地完成(0 Token消耗),仅10%-20%任务上云”的混合架构,极大压缩用户使用成本。

当下,一方面是云端大模型的价格战激烈,各家降价背后,是Token需求爆发与供给过剩的双重挤压。

另一方面,端侧硬件能力正在快速进化。国产NPU等下一代芯片的成熟,可能带来芯片侧的一次大变革。

王冠博判断,“现在还没有到特别适合做硬件的阶段”,因为芯片技术尚未收敛,过早定型反而会增加迭代成本。但通过与B端硬件厂商的合作,也是率先抢占生态位的另一种路径。

AING硬迹

AING,取自“AI+ING”的缩写,中文谐音“硬迹”,寓意着“人工智能正当其时”,致力于追寻硬科技发展的足迹,不断探索人工智能与智能硬件的深度融合。

未来,AING硬迹将不断发布AI大模型技术、AI产业生态、AI硬件产品等行业资讯、发展趋势与市场动态,我们相信大多数硬件都值得用AI重做一遍,AING硬迹期望与AI大模型厂商、与AI硬件厂商共同成长,迎接AI时代的来临。

打开网易新闻 查看精彩图片

人工智能正当时

一起追寻AI+硬件的足迹