把一台能运行122B大模型的AI主机塞进口袋,需要付出什么代价?两个月前,国内掀起本地部署Agent热潮,Mac mini意外出圈,三四万元的英伟达DGX Spark同样热度不低。但前者难撑更大模型,后者价格功耗难大众化。大算力、低功耗与小体积之间,似乎始终难以兼得。

联想最近发布的AI主机P7给出了新答案:300克、30W功耗、190TOPS端侧算力,本地运行122B参数模型。这不再是AI PC的简单升级,而是一种介于AI PC与AI工作站之间的Agent Computer新物种。

打开网易新闻 查看精彩图片

传统AI一问一答,任务结束模型即停。Agent需要长期在线、持续调用模型、自主拆解任务,在本地完成记忆、推理、执行全流程。这意味着比拼的不再是瞬时性能,而是长期稳定运行能力。P7的无网自主推理速度最高50 Tokens/s,可7×24小时连续执行Agent任务,甚至能用充电宝供电。

支撑这一形态的是存算一体架构。传统芯片计算与存储物理分离,数据频繁搬运带来能耗与延迟。P7搭载的160TOPS dNPU来自后摩漫界M50,采用存算一体设计,典型功耗仅10W,能效达传统架构5~10倍。联想与后摩智能联合攻坚十多个月,才实现千亿参数模型在300克设备上的稳定运行。

P7已支持千问、智谱、DeepSeek等主流模型,并可Day0适配新模型。英伟达收购Groq LPU技术同样指向存算一体路线。当AI从峰值算力比拼转向能效比与持续推理能力,新的架构窗口正在打开。Agent Computer或将成为AI 2.0时代最具落地潜力的终端方向。