智东西
作者 毕伟豪
编辑 漠影一、1000倍算力缺口,AI主机的硬门槛为什么在CPU二、三大场景开箱即用,千元级主机让Agent走进生活三、超长上下文硬扛金融场景,一颗芯片给Agent兜底四、端侧低成本推理,Token不再花钱如流水,Agent常驻后台五、家庭共享零门槛,蓝牙配网、无需键鼠结语:为Agent推理而生的芯片,正在重写AI硬件的规则

打开网易新闻 查看精彩图片

智东西6月12日报道,这两年,随着Claude Code、Codex越来越能打,龙虾(OpenClaw)、爱马仕(Hermes)这类开源AI助手接连爆火,“智能体”热度飙升,Agent时代就此到来

打开网易新闻 查看精彩图片

现在,越来越多的人从聊天机器人转到Agent,开始使用各种工具来完成日常生活中的任务,相比于简单对话,Agent的Token的消耗量是巨大的

因为现在的Agent可以真正帮人干活,比如写软件、盯股市、做PPT、剪视频等等,以前聊天机器人回答问题,通常仅需一两步推理,而现在一个金融Agent,要同时跑行情分析、财报解读、交易决策等多项任务,一项任务就需要几十步甚至上百步连续推理,算力需求根本不在一个量级

打开网易新闻 查看精彩图片

不久前,英伟达CEO黄仁勋在访谈中做出了这样的判断:Agent时代,算力需求将暴涨到生成式AI的1000倍,整个行业会被推着进入全新的竞争阶段。

打开网易新闻 查看精彩图片

算力需求指数级的增长带来了两个问题:第一是普通人该如何部署Agent、配置和使用前沿AI工具,第二则是黄仁勋所说的1000倍的算力缺口由谁来填补。

前沿Agent安装部署难度高、配置复杂,而云端模型调用的延迟、Token消耗量、数据隐私安全等问题,正在推高端侧推理需求,人们需要一台真正能降低Agent使用门槛、并且可以在端侧执行更多、更复杂任务的主机

黄仁勋所说的1000倍算力缺口不可能全由云端填补,AIPC走进市场,将推理更多转移到端侧,正是重要的解法。但以前的AIPC只是把机器当成了能跑大模型的PC,而不是为Agent推理专门设计的计算机

一台从内到外均为Agent推理而生的AIPC,在这个时代的优势逐渐凸显,能在本地使用Agent执行任务,也可以凭借软硬件优化提高计算效率,节省Token开支。

而一款好的主机,核心在于芯片,对于芯片而言,不论是端侧、边缘还是云端,CPU的重要性都不言而喻。AMD CEO苏姿丰曾在采访中直言,每个Agent运行过程里都在持续调度CPU,GPU只在调用模型那一步起作用,其余分配任务、搬运数据、调工具都走CPU。

打开网易新闻 查看精彩图片

因此,未来Agent执行的任务越复杂,CPU的分量就越重,只有为Agent专门设计的芯片,才能更好满足Agent爆发带来的需求。

此芯P1就是这样一颗芯片,在架构层面,它为Agent推理做了定向优化:12核Arm v9.2 CPU,主频可达3.2GHz,集成10核Arm Immortalis-G720 GPU以及专用NPU,异构总算力达45TOPS,可以为大模型的本地化部署提供开箱即用的算力支撑。

作为专为Agent而生的AI主机,联想AI主机mini搭载此芯P1,这也是此芯和联想在共同定义“Agentic Compute”新标准过程中的产品,要让更多人享受到Agent时代的前沿成果。

这台千元级别的主机,体积只有Mac mini的一半,平均功耗仅15W,运行噪音低于30分贝,却能释放此芯P1的45TOPS综合算力,在多个Agent使用场景中表现稳定。

这台搭载此芯P1的联想AI主机mini,预装了天禧Claw,开箱即用,支持多成员共享,数据隔离、记忆独立,一个仅有巴掌大小的千元级主机,将使用Agent的门槛直接砍到了底

打开网易新闻 查看精彩图片

Agent确实好用,但部署Agent、接模型API,配置以及使用那些前沿工具,本身就存在门槛,对大多数人来说,“开箱即用”才是接触Agent最现实的路径。如何让Agent走进每个人、每个家庭的生活,是无数厂商思考的问题。

打开网易新闻 查看精彩图片

联想AI主机mini依靠天禧Claw,可以实现7×24小时无人值守,全天候服务,并且无需部署和配置,真正实现了Agent开箱即用,门槛接近于零,同时设备支持手机、平板等多端互联以及多成员独立使用,随时随地都能调用Agent完成任务。

打开网易新闻 查看精彩图片

在炒股、自媒体创作、家庭共享这些需要Agent需要持续运行、多步推理、同时处理海量信息的场景中,这台搭载此芯P1的主机表现很稳。

金融场景中,数据源又杂又多,实时行情流和静态财报混在一起,还不能丢失信息,这让Agent的工作负载压力变得非常大。

比如一个散户通过配置,让Agent同时盯着股市、财经媒体、大公司官网和社交平台,说一句“盯着新能源板块,有变动立刻弹窗发给我”,Agent就得同时消化好几种不同格式的信息,做深度推理。

打开网易新闻 查看精彩图片

如果上下文窗口不够长,Agent在处理半路上很可能自动丢掉前面的关键数据,给出建立在残缺信息上的判断,这在金融场景中,是相当致命的

搭载此芯P1的联想AI主机mini,最高支持200K超长上下文,对需要Agent持续盯盘的用户来说,上下文长度直接等于安全底线,这种超长的上下文窗口,让联想AI主机mini在金融场景中非常能打。

能满足金融场景的使用需求,对其他需要长上下文推理的日常场景自然如鱼得水

很多自媒体创作者已然成为Agent的重度用户,搜热点、列大纲、写文案、配图排版等等,每一步背后都有Agent的身影。

聊天机器人一次对话通常仅有一到两轮推理,而Agent完成一个创作任务可能是十几轮甚至几十轮连续推理,全程走云端大模型API的话,一天Token费轻松超过一顿外卖,一个月的账单可能会非常惊人,放在端侧推理支出就更加可控。

联想AI主机mini就是这个思路,尽可能把工作搬到本地,从而大幅度降低Token的消耗

打开网易新闻 查看精彩图片

搭载此芯P1的联想AI主机mini支持运行本地轻量模型,可稳定承载13B–35B生产级Agent部署,外加拓展卡可支持7B-122B模型运行,远超主流7B离线部署边界,简单任务可以在本地实现闭环

同时,此芯P1针对Agent场景做了定向优化,首发搭载Ubuntu 26.04和Linux 7.0 kernel,P1的异构算力驱动、NPU调度、内存管理都在这些系统上做了深度适配。

其12核Armv9.2 CPU设计可以实现Agent执行任务时的精细化调度,在多任务并行时具有优秀的能效表现,NPU设计也能提高模型的计算效率。

在实际测试中,搭载此芯P1的联想AI主机mini将执行复杂任务的Token消耗量降低了60%,速度提升50%-70%

低成本推理是Agent普及的经济前提,当推理成本降下来,Agent才可能从偶尔用一下变成日常跑在后台。

AI硬件翻车最多的地方不是跑分低,是买回家只有一个人会用,空有强大算力,却不能共享。传统mini主机的开箱流程是:翻键鼠、找网线、插显示器、进BIOS调试,这种操作过程本身就是一堵墙。

而联想AI主机mini绕开了这堵墙:手机蓝牙靠近自动配网,微信小程序扫码绑定,不用接键鼠,不用插网线,并且可以实现多设备连接与多人共享

打开网易新闻 查看精彩图片

老人查菜谱、小孩问作业,一台主机放在电视柜上,全家人各用各的Agent,对着手机说话就行。

打开网易新闻 查看精彩图片

这个体验能立住,靠芯片在底层撑起三条线:多用户、多任务并行处理靠12核CPU的设计;一个人折腾崩了系统,独立Recovery分区配合一键恢复,全家不受影响;64GB LPDDR5内存低功耗运行,带宽高达100GB/s,能够实现24小时待机,兼顾功耗与性能平衡。

面向家庭和中小团队的AI主机,安全信任是另一个硬需求。此芯P1在芯片层充分利用了Arm v9.2的安全特性,包括PACBTI指针认证、MTE内存标签扩展和Secure EL2硬件虚拟化,多人共用一台机器跑各自的Agent,数据不串区,保证安全性。

P1还过了Arm SystemReady L6认证,这是数据中心级的硬件合规标准,主流Linux发行版可以开箱直装。而OTA在线升级,可以让芯片算力释放能力随系统迭代持续提升,买回家的硬件能够越用越好用。

AI主机这个概念喊了两年,但真正能让Agent从聊天框里走出来的硬件,不是塞个大模型进机箱,也不是给PC换个壳贴个AI标签。

芯片得在底层回答这些问题:Agent推理能不能一次处理足够长的上下文,端侧推理能否执行更多更复杂的任务,多任务并发时系统能不能稳住。

此芯P1选了Agentic Compute这条路,从芯片架构的第一行代码开始,就为Agent推理做定向设计,通过“端云协同,端侧常驻”的模式,打造为Agent而生的计算能力。

未来,评判一台AI主机优劣的标准,将从跑分多高,逐渐变成Agent跑得省不省、稳不稳,Agentic Compute时代,AI主机的规则正在重写。