来源:市场资讯
(来源:网易科技)
作为科技界最受尊敬的运营者之一、市值达2250亿美元的网络安全巨头帕罗奥图网络(Palo Alto Networks)CEONikesh Arora近日做客 Harry Stebbings 的播客节目。
在这场深度对话中,这位曾在谷歌担任5年首席营销官(CMO)的硅谷传奇高管,以极其锐利且务实的“一线视角”,拆解了当前大模型泡沫下的企业落地真相。他直言:“超过一半的企业从使用AI的角度来看仍然没有做对,他们只是把AI当作‘打补丁’的边际改良工具。”同时,他深入剖析了前沿模型在消费端与企业端的本质张力,并做出了多个极具预见性的论断——包括代币(Token)定价未来将暴跌90%、“记忆与上下文”将成为前沿模型唯一的生死护城河,以及物理学规律和能源短缺将如何撞上 AI 基础设施的墙。
核心观点提炼:
超过一半的企业只是在做“边际改良”
Nikesh Arora 认为,当前超过一半的企业在使用 AI 的方向上依然存在误区。多数企业仍然忙于将 AI 强行融入现有的业务流程中,仅仅将其视为提高边际效率的工具,这并非 AI 的真正效益所在。他强调,未来的大赢家必然是那些利用 AI 从根本上重新构建公司工作流的组织。
在谈到具体落地时,他指出企业需要放弃传统的人类控制权,让 AI 承担 80% 的思考与判断工作。例如在招聘流程中,企业应当让 AI 直接筛选简历并生成针对性的面试问题,实现流程的绝对智能化。他直言,目前多数企业仅将 AI 用于扫描发票等重复性工作,这种边际改良是错误的。他断言,未来“AI 应用将彻底取代没有观点的 SaaS 软件”,拥有独立观点的 AI 助理将大幅提升员工的平均能力,并削减企业内部冗余的流程管理人员。
前沿模型的“广度” vs 企业级智能体的“难度”
Nikesh Arora 提出,前沿模型的核心矛盾在于“广度(Breadth)与深度(Depth)”的张力。他将市场划分为消费级与企业级两个截然不同的光谱。
在消费级领域,他认为这本质上是一个“广度”问题。由于消费者对模型误报的容忍度极高,且中间总有做出最终判断的人类,因此大模型公司都在疯狂追逐消费级品牌,以获取后训练数据并形成类似谷歌搜索的巨大分发乘数效应。但在企业级领域,这演变成了零容忍的“深度”问题。他以 Waymo 自动驾驶为例,指出真正的企业级智能体需要数百亿美元的极端情况(Edge Case)训练和无法在互联网上获取的专有数据。他强调,企业无法通过直接将一个通用的前沿大模型塞进传统业务来实现智能化,真正的企业级营收必然建立在对特定场景的深度理解之上。
算力被免费消费者“吸干”,Token 定价未来将暴跌 90%
针对行业内普遍关心的算力与代币(Token)成本问题,Nikesh Arora 指出,算力的极度稀缺与超额成本正在强加高昂的定价。他揭示了一个行业痛点:目前全球超过一半的算力正被用于喂养完全不盈利的免费消费端查询。
由于免费消费端吞噬了海量资源且无法回收成本,前沿 AI 公司正将全部的财务压力转嫁给企业端的编码与应用场景。然而,基于技术研发效率的提升以及未来算力供需的合理化,他做出了一项重大预测:在接下来的 3 到 5 年内,Token 的长期定价将会暴跌至今天的十分之一。此外,由于免费用户在经济层面的不可持续性,大模型公司在获取足够的数据后,未来必然会收紧并限制消费者对 AI 的无节制使用。
“记忆与上下文”是大模型唯一的生死护城河
在谈及产业链的价值累积时,Nikesh Arora 承认目前基础设施方赚取了由于稀缺性带来的超额利润,但他质疑物理学规律、能源短缺和数据中心产能的上限很快会引发基础设施行业的消化期。他认为,应用层在历史上首次展现出了拥有记忆和理解上下文的能力。
他坚信,大模型未来的价值核心将取决于谁能掌握更深的用户上下文(Context),大模型公司在未来一两年内会疯狂围绕消费端构建“记忆”。模型对用户历史对话、背景了解得越多,创造的粘性和壁垒就越不可动摇。他进一步警告,由于前沿模型正在将记忆深度融入自身架构,那些试图通过第三方编排层实现“模型无关(Model agnostic)”的开发者将面临巨大风险。最终,企业将会被某一款特定模型深深“俘获(Captive)”,因为一旦切换模型,企业将不得不重新设计并重构整个深深嵌入了原模型能力的应用体系。
热门跟贴