最近几天,关于第二代豆包 AI 手机,又有了新的消息。行业媒体芯流智库独家报道称,中兴努比亚已经全面收缩其他手机线,把核心资源集中到第二代豆包 AI 手机上,并计划月内发布。
没几天了。
虽然这个说法目前还没有得到中兴通讯、努比亚或者字节跳动的官方确认,但它从过去半年公开的信息看,努比亚和字节跳动花了很大力气推动新一代豆包 AI 手机。包括今年 2 月底的 MWC 上,努比亚总裁倪飞其实就预告了这款「定义手机新物种」的第二代豆包 AI 手机。
图片来源:微博
再而往前三四个月,第一代豆包手机以努比亚 M153 的形式出现,尽管还是一台搭载豆包手机助手技术预览版的「工程样机」,但产品的实际完成度已经很高了。
更耐人寻味的,也是豆包手机真正引发讨论的地方:用户可以通过自然语言让它跨应用操作,做比价、修图、查票、下单、发消息,甚至在某些场景里像一个真正拿着手机的人一样,一步步点开 App、识别界面、完成任务。
第一代豆包手机直接把过去几年手机厂商反复讲的「AI 手机」,实际推进到了「AI 替你操作手机」这一步。
但当 AI 不再只是回答问题,而是基于 GUI(图形用户界面)代替用户点击屏幕、调用应用、访问相册、处理支付和社交关系,不可避免地碰到权限和隐私问题,也冲击了今天的互联网商业生态。
第一代豆包手机很快撞上了这堵墙。微信、支付宝、银行、购物平台……都本能地紧张,对它的调用和操作做出限制,外界也开始更大规模地讨论系统级权限、模拟输入、账号安全和隐私边界。
这是第二代豆包 AI 手机必须回答的问题:不能只比第一代更快、更贵、更像旗舰,还要解决隐私难题,从一台「工程样机」,变成一台普通人放心使用的量产机。
硬件升级,给 Agent 留出空间
目前关于第二代豆包 AI 手机的硬件信息并不多,比较明确的消息是,有望搭载第五代骁龙 8 至尊版。考虑到第一代 M153 已经用了骁龙 8 至尊版、16GB+512GB、6.78 英寸 LTPO 屏和 6000mAh 电池,第二代继续用旗舰平台并不意外。
一代豆包 AI 手机,图片来源:雷科技
用传统手机逻辑看,这些参数其实没什么新鲜感。2026 年的安卓旗舰,谁没有旗舰芯片、大电池?但第二代豆包 AI 手机真正应该变化的地方,是硬件围绕 Agent 重新做取舍。
过去手机硬件服务的中心是 App。芯片要保证应用启动快,屏幕要保证显示好,影像要保证拍照强,电池要保证一天够用。AI Agent 加进来以后,手机会多出一类持续运行的任务:
要理解用户指令,能识别屏幕内容,可以随时调用相机、麦克风、定位、相册、日历、通知和应用状态,要在云端模型和端侧模型之间做判断,还要尽可能不拖慢系统、不明显增加发热和耗电。
这意味着第二代豆包 AI 手机需要的不只是更强的 SoC,更要一整套围绕端侧 AI 的系统工程。
另外按照高通对这颗平台的描述,第五代骁龙 8 至尊版除了 CPU、GPU、NPU 性能的继续提升,这代的核心升级还有端侧学习、实时感知、个人知识图谱和 Agentic AI 能力。
如果第二代豆包 AI 手机搭载这颗芯片,它最该利用起来的就是端侧能力。比如可以把一部分个人记忆、偏好、常用联系人、常用任务流程放在端侧处理。用户说「帮我订明天去广州的票」,它不应该每次都从零开始问一遍偏好,而是应该知道用户常坐哪类席别、常用哪个出行 App、发票抬头是什么、是否倾向早上出发。
图片来源:高通
端侧记忆越充分,AI 越像一个真正理解用户习惯的助手。
再比如,多模态理解也应该更多走端侧。用户在任意界面问「这个靠谱吗」「帮我总结一下」「把这里的地址发给他」,AI 需要快速理解屏幕内容。每次截图上传云端,速度、隐私和稳定性都会有压力。
更强的 NPU、内存和本地模型,可以让这些轻量任务在手机上直接完成。
还有一个更容易被忽略的地方:散热和续航。传统旗舰手机的高负载主要来自游戏和影像,用户可以感知,也通常有明确时长。但 Agent 的高负载可能更碎、更频繁。它不一定每次都跑满性能,却可能一整天在后台等待、监听、识别、摘要、检索。
所以,第二代产品大概率会继续堆大电池,也可能在散热、内存、存储和系统调度上都会有改进。甚至可以进一步推测,它的硬件设计会围绕几个 AI 入口强化:独立 AI 键、更高质量的麦克风、更稳定的语音唤醒、更强的屏幕内容识别、更好的隐私提示,以及更适合长时间握持和语音交互的机身设计。
从一代到二代,从「操作」到「协作」
更重要的还是 AI。到了今天,几乎可以断定第二代豆包 AI 手机在「代理」路径上会有很大的改变,因为外部环境已经完全不一样了。
图片来源:OpenClaw
过去半年,OpenClaw、Claude Code、Codex 等重量级产品,让 Agent 生态发生了一个很重要的变化,即互联网平台加速拥抱 Agent,通过 MCP、A2A 协议或者官方 Skill 实现 Agent 的交互。
MCP 解决的是 AI 如何连接工具和数据源。它把过去一个个定制化接口,变成一种更通用的连接方式。对开发者来说,AI 不必为每个服务单独写一套调用逻辑;对服务方来说,它也可以用更标准的方式暴露自己的能力。
A2A 解决的则是智能体之间如何通信。手机系统助手可以是一个 Agent,微信、支付宝、飞书、淘宝背后也可以有自己的 Agent。
系统助手不一定非要像人一样去点微信界面,而是可以向微信的 Agent 发出一个明确请求:给某个联系人发一条消息,或者发起一次视频通话。微信再在自己的安全边界内执行,并把结果返回给手机助手。
听起来只是技术路线变化,但对 AI 手机却是非常关键。第一代豆包手机尝试「替用户操作 App」,但基于 GUI 的 Agent 技术路线对现有生态冲击太大,相比之下,基于协议的 Agent 技术路线反而越走越宽。
微信最近与多家手机厂商推进 A2A 助手能力,就是一个很明确的信号。微信并没有完全打开自己的生态,但它开始允许手机系统助手在特定场景下调用微信能力,比如发送消息、发起音视频通话。整个过程强调双重授权,也强调由微信自己执行并返回结果。
图片来源:微博
包括豆包,过去半年也学起了千问,一方面连接自身的电商、支付等服务能力,一方面也在连接第三方平台的服务。比如今天,豆包 APP 就在北京、杭州两地启动了一键打车的灰度测试,由曹操出行负责提供打车服务,用户直接在聊天框里说出行需求,系统自动识别地点、人数、偏好,匹配路线和价格后一键确认下单。
图片来源:微博
所以可以预见的是,第二代豆包 AI 手机可能会保留 GUI Agent,因为大量中长尾 App 不可能马上接入标准协议,但面对一些高风险服务和强势平台,需要更多协议化、授权化的连接。
能用 A2A 或类似机制调用的,就不要再强行模拟点击。必须模拟点击的,也要有更清晰的权限提示、操作回放、关键步骤确认和风险拦截。这会让第二代豆包手机看起来没有第一代那么「野」,但也更接近一台真正能卖给普通人的手机。
成熟的AI手机应该更「克制」
过去两年,手机行业讲了太多 AI,很多功能听起来热闹,但真正给用户带来的改变却不大,所以豆包手机狠狠刺激了一波手机行业,也让 AI 手机的竞争加快进入应用生态和操作权限的深水区:
手机厂商忙着重新定义系统助手,互联网平台忙着重新定义开放边界,芯片厂商要继续为端侧 Agent 提供更强大的算力和能效,开发者也要考虑自己的 App 如何被 AI 调用、被 AI 理解、被 AI 分发。
所以第二代豆包 AI 手机会不会长成这样?我们还无从确认。
但真正成熟的 AI 手机,在人与 Agent、Agent 与设备的交互上应该是更克制的:在大多数场景里应该让用户少操作,但在关键场景里必须让用户清楚地看见 AI 正在做什么。它可以帮用户填表、比价、整理行程、修图、总结文件、发起沟通,但涉及付款、发消息、账号登录、金融等敏感操作时,应该有明确的确认和可追溯记录。
另一方面,就像雷科技之前文章中表达的,AI 手机不能把 GUI Agent 当成唯一答案,也不应该全盘抛弃 GUI Agent 的通用性优势,毕竟面对很多中长尾 App,开发者从精力、成本考虑就不可能在第一时间适配 Agent 的交互。
同时 AI 手机也不能只依赖云端模型,端侧 AI 能力的改进也势在必行,端侧低延迟、少打扰、能记住偏好、能理解上下文的一系列能力,才能确保日常的体验。
如果第二代豆包 AI 手机都能做到这些,它的意义不只属于豆包和努比亚。
热门跟贴