引言
LLM-OS (Large Language Model Operating System) 即将到来,99.99% 的普通开发者还有机会吗?如果有,那什么样的 app 才能活下去?
本文写给那些仍在寻找方向,不甘被 LLM-OS 边缘化的开发者与产品人。
文|姜迅
智塔 AI CEO
我们面前的三个问题
1. 在 LLM-OS 之外,是否还能诞生超级 app?如果可以,机会藏在哪里?
2. 如果 MCP 是可见的未来,是否应该投入开源基建,还是在垂直领域中悄悄孕育?
3. 选择大于努力——选择什么样的场景才更有生命力?什么是你的护城河?
为什么要思考这些问题?
只有0.01%的天才,有机会能进入OpenAI、Google、Meta、ByteDance、DeepSeek的模型团队。而对于 99.99% 的普通开发者来说,大模型的底层架构不是我们的主战场。我们真正的机会,可能在于构建一个能被调用、被信任、被保留的 App。究竟怎么做,才有可能在新范式中活下来?
站在未来看现在!
我并不确定今天提出的判断是否正确,但如果能多站在未来看现在,也许能提高在当下做出正确选择的概率。
这篇文章并不追求终极答案,而是试图提出一些可能对未来有价值的观察与猜想。只有抛出问题,才能引发更多人的讨论、碰撞与验证。
观察一: Always Online
回顾过去,第一轮PC互联网/浏览器战争的时候,我更多是作为用户参与其中。第二轮移动互联网,我作为从业人员经历了完整的过程。
我非常清楚地记得2011年时的一个观点,手机是插座,人是插头,手机作为插座是 always online 的,而人作为用户,是可以 offline 的。
LLM-OS 将成为每个人的 “agent”,而不只是工具。它将永远在线、永远响应、甚至代替你做出越来越多的决策。比如你只说一句“我要去武汉出差”,agent 就会基于你过往的喜好、出行习惯、会员等级,自动完成航班预订、酒店安排、会议排期。主动决策权从人手中滑落,交由 agent 之间的协商系统来计算出“全局最优解”。
可以预见可能的变化是:未来的操作系统将是 agent 驱动的,它未必是一个工具,而更像是你的数字人格或角色化外设。
操作系统本身也会变成一个超级 app,它不再组织窗口和程序,而是组织任务、意图和决策链。
观察二:从“切水果”到“超级淘宝”
App 可能的进化路径
回顾移动互联网的发展,可以看出明显的阶段性演化轨迹:
•2010 年:爽点小工具时代,如切水果、美图秀秀
• 2014 年:平台型 app 崛起,淘宝、微信、今日头条等建立多边生态
•2020 年:超级入口之争白热化,支付、社交、电商开始整合资源和流量
我们今天看到的 LLM 应用(AI 简历生成器、AI 配音工具),很像“切水果时代”的产物。我们正在进入下一阶段:
• 从 LLM 小工具 → Agent 协调系统 → 用户私有 Agent 网络
• 从一次性工具 → 调度行为 → 绑定习惯和信任
能否成为 agent 网络中的“常驻角色”,将决定一个 app 是否能活下来。
观察三:Agent 是绝对听话的员工/助理
但听话不意味着好用
LLM 的一大特征是,它拉高了所有人的下限,同时也提升了不同人的差距的绝对值。每个人都可以拥有一个“超级能干、永远不抱怨”的员工。但这不是终点。
以 Cursor 为例,它让很多人第一次感受到一个工具可以如此聪明、高效、无条件配合。但它也暴露出一个问题:
LLM-OS 是“绝对执行型”的,它会用最拧巴的方式完成你最含糊的指令。它并不偷懒、不犯错,也不是不想帮你,而是因为你没表达清楚,它也不懂你真正的上下文。
因此,在 agent 时代真正胜出的 app,不是功能更强的那个,而是上下文更完整、语义更贴近用户真实意图的那个。谁能够这个 agent 的上下文更完整,更理解你的语义,就更能征服用户。
观察四:MCP 把 App 变成“协议容器”
流量分发逻辑将被重写
传统 App 是 UI + 功能的集合体。用户打开它,用按钮或手势来调用功能。但 MCP (Model Context Protocol) 带来的范式转变是:
App 不再是一个视觉入口,而是一个可被 agent 理解、信任、调用的声明式服务容器。
• 功能 → 能力声明(Manifest)
• 接口 → 可组合协议
• 流量 → 系统级 agent 决定调用谁,而不是用户点谁
因为这样的协议和算法逻辑存在,类 MCP 协议 + 全局最优导向的 agent 网络,正在重写“谁分发谁”的底层逻辑。基于上面的观察,我们可以一起尝试下述的思考。
思考一:我们真正面对的用户是谁?
在 LLM-OS 时代,我们所面对的“用户”也许不再是传统意义上的人,而是系统中的 LLM 本身。因为你需要赢得的,可能不是用户的一次点击,而是:
• LLM 是否选择调用你?
• Agent 是否信任你?
• 你的模块是否在任务链中被持续引用?
所以你的产品必须不仅能打动人,也要能打动 LLM。这是一种全新的产品设计逻辑。
思考二:写在基因里的“入口焦虑”
放弃入口,是否就只能被收割?
在移动互联网时代,每个从业者的基因里都写着一种恐惧:如果你没有用户的直接触点,就只能成为一个被系统无差别调用的接口,最终被边缘化。
这种恐惧,在 LLM-OS 时代依然真实存在。
随着 GPT-4o、Copilot、Apple Intelligence 等系统级 agent 成为新的“一级入口”,用户不再打开 app、搜索功能、逐个筛选;他们只会说一句话,系统就自动调用多个工具组成链路,一次性完成任务:
“帮我订今天去武汉的行程,晚上 7 点开会、顺便把报告做个摘要。”
在这样的世界里,如果你的产品只是任务链中的某个工具节点,你可能不会被展示 logo,用户不会记得你,你甚至都无法定义自己的触达方式。
LLM-OS时代,我们需要重构对“入口”的认知
如果继续坚持“要争夺首页、打造一级流量池”,那注定会失望。
新的范式要求我们换一种思维:我不拥有用户,但我要成为系统 Agent 调度闭环中不可或缺的节点。
入口不再是图标的有无,而是你在系统多约束决策图中的节点权重。
衡量标准不再是点击率,而是:如果我被移除,系统完成任务的效率是否明显下降?
案例反思:从凤巢到 LLM-OS,我们的流量信仰如何改变?
在 PC 互联网时代,百度凤巢是流量分发的绝对权力中枢——大量的人工规则驱动精准投放;Google 则相信“不作恶”的算法,构建起开放式搜索逻辑,追求全局最优分发。
而在移动互联网时代,app 图标锁定了数据流动路径——数据只能在 app 内部流转,搜索引擎、外部协议再也无法进入封闭的 app 生态,对入口的渴望,写在了每个创业者的基因里。
今天,当 LLM-OS 来临,我们重新站在人与系统之间,agent 成为新的黑盒分发者。
但这一次,我选择相信全局优化。当LLM-OS来临的时候,作为黑盒的 agent,对于系统全局优化的,我有更多的相信,找到那条必须经过你的河口,深挖数据、把秩序写进协议,然后静待流量自来。
当然,这种看法是否是一厢情愿的看法是一个值得讨论的话题,我们还有哪些机会影响默认的 agent 行为”?靠什么?靠开源协议、靠社区投票、靠节点自治?全局最优≠公平分配。算法倾向集中,但协议+社区共识可以在自愿层面拉平收益分布。
同时,调度权不是系统赠予的,而是协议硬嵌+数据强绑定+用户显性选择的结果。选择相信长期的全局最优调度逻辑,但也必须承认——在系统尚未成熟的早期阶段,默认入口是极度暴力的,系统可能依据默认分发路径做出次优选择,而你的产品甚至不会被展示 logo。
因此,在协议尚未普及之前,品牌显性调用、用户显式选择仍是关键补位手段。比如用户显式指定:我要使用 Theta Health MCP 查看健康数据。品牌作为显性指令进行非常态补位的同时,还可以提Agent决策树中提高PRIOR。
思考三:低频 = 价值低?未必
在传统产品时代,“高频”意味着 DAU、MAU、点击率、使用频次等活跃指标,决定着产品的生死和估值。
但在 Agent 时代,这套逻辑正在被彻底改写。
《经济学人》的一张图表揭示了用户行为的巨大转变:AI 正在扼杀传统的网络搜索。 整体流量下降了 15%。其中健康问题的搜索下降幅度尤其惊人——暴跌了 40% 以上。人们并不是不再关心健康。而是他们不再用浏览器搜索问题,而是开始提问。人们转向 AI 寻求答案,从公开的搜索框转向了私密的对话界面。
这是我们所见过的用户意图最大规模的迁移,而这仅仅是个开始。
当用户向 AI 提出复杂的健康问题时,系统面临一个根本问题:如果无法访问用户的真实健康数据,智能体如何提供安全、个性化且准确的回答?
它做不到。 泛泛的建议毫无用处,猜测更是危险。
这正是我们在为之奋斗的未来。我们正在为这一新范式创建基础层:全球第一个健康 MCP,Theta Health MCP。
因为只要一个 MCP 服务能被 Tools/List 发现,并对用户处于 enable 状态,它就是“在线”的 —— 即使用户从未主动点击,它也可以在某个上下文中被 agent 自动调用。也就是说:
“在线”不再由用户决定,而是由 agent 的调度算法决定。例如,在一次酒会的闲聊中,一群朋友打趣着比较谁的酒量更好。此时,每个人的 agent 可能会触发一个任务链:
• 查询某个 MCP 服务中的基因数据(如 ADH1B、ALDH2 等与酒精代谢相关的位点)
• 调取用户过去 10 年的肝功能检查、B超报告等
• 通过 Agent 网络中的知识模块判断:谁的酒精耐受性更强,谁更容易醉。
你无需主动打开 app,它也无需成为“高频使用工具”。但它完成了任务链中不可替代的一环。
这是我所理解的 LLM 时代对 app 的重新定义:
对单个用户的“低频”,可以通过大数法则,在全网形成“统计学意义上的高频”。因为“在线”的定义已经发生了变化,所以“使用频率”不再是价值的核心指标。真正的价值,来自你是否能被系统持续调用、是否处在 Agent 协作链中的关键节点。
新的价值河流,正在改道。
思考四:机器共识之外,还需要人类共识吗
在多智能体系统中,算法之间达成共识的速度越来越快。任务分解、能力调用、路径规划……agent 网络很快就能协商出一个系统级的全局最优解。但问题来了:
在机器之间的共识之外,产品是否还需要获得“人类的共识”?
我个人认为是的,而且越来越重要。
共识,是让每个人都能参与。人类的共识无法靠算法自动完成,它必须通过参与感、表达权、反馈路径慢慢建立。一个让人信任的系统,不只是“自动化”,而是让人觉得“自己也能参与其中”。
过去我们常说:
Talk is cheap. Show me your code.
但今天,代码门槛不断降低、工具泛滥,也许我们该反过来说:
Code is cheap. Show me your talk.
代码已不稀缺,每个人都可以通过 talk 来构建自己的代码宇宙。我们应该更坚决的拥抱开源社区和生态,不仅仅为了取悦开发者,成为一个对所有用户都“信任 + 可解释 + 可共建”的 app 产品。
真正的“意义流动”发生在关系与参与之中。如果能让人参与到规则共建、数据标注、agent 进化中,那么这张“社会信任网络”将远超系统内协同的力量。
在 LLM-OS 时代,我们很难用封闭图标护城河对抗算力巨头;唯一可行且可放大的武器,是把接口和规则写成公开共识,再用公开代码让所有人验证你在守规则。
代码开源、协议共识、运营收费——这一套,可能是 99.99% 创业者通往长期生意的现实路径。
思考五:人类程序员在Cursor中的作用
这个问题我完全没找到答案,想作为开放内容和读者们一起讨论。
现在,几乎所有开发者承认 Cursor 的代码能力比自己强,上限比自己高,Cursor 已经能根据提出的问题,自动设计测试用例,自动编码,自动回归,自动发布。甚至 Claude Code 已经变成默认对代码进行 accept。Cluade Code甚至不在意所谓的人类标注 “accept/reject” (可能不需要)。
那从技术的角度,为什么还需要人类程序员去盯着屏幕看着滚动的 Cursor 代码呢?人类程序员在此过程中的价值是什么?我还没找到这个问题的最终答案,但直觉告诉我:人类程序员的价值,可能正转向那些不易被模型取代的任务。
提出这个问题,不是为了为赋新词强说愁的要给程序员写代码寻找价值。如果我们搞清楚 “人类程序员在 Agent 协作链中的真正锚点”,也许就能找到下一波工具或平台的形态。
回到文章的最初的三个问题,我们来尝试讨论那三个问题。
讨论一:在 LLM-OS 之外,是否能诞生
“超级 App”?机会藏在哪?
我认为可以,但不再是“图标型超级 app”,而是成为 agent 系统中不可替代的能力模块,协议图谱中权重最高的节点,被信任、被调用、能完成闭环的“任务角色”。
未来的 app 世界观不是“每个产品一个界面”,而是“每个功能一个协议”,是被调度的,不是被打开的。
讨论二:MCP 是不是未来?
投身底层协议还是垂直场景?
MCP 是未来,但不是“定义即胜利”。现在全力只做“全栈 MCP 生态”,对一支 0-1 阶段的团队大概率是烧错黄金期。最快的胜率往往是:用一个“冷门且高壁垒的垂直场景”当楔子,先把协议的 运行时+治理模型+社区惯性栽进土里;等垂直验证跑通、数据与信任沉淀后,再把同一套 Runtime 横向扩展到更大生态。
换句话说: 没有杀手级垂直把协议落在地面,横向平台拿不到血液流动。窗口期实质是,谁先拿到一条真实业务链的“流水线范例”,谁就握话语权。
我们要的是一份可上台面的演示——“从 CGM 原始流 → 事件化 → LLM 调用 → 用户问题解决”的全日志。
有了它,无论在健康、金融还是物流,别人都更倾向复用已被用户、合规、监管咬过一遍的 Runtime。真正的黄金期不是赶热点,而是用垂直硬场景在大家还没确立心智前,把“协议习惯 + 运行时依赖”悄悄种下 —— 等生态成形,巨头也只能沿我们的轨道加速。
讨论三:选择什么样的场景更有生命力?
什么是你的护城河?
如果我们相信,未来系统的演进将不是线性推进,而是来自模型能力的不断突破与真实业务需求的持续反馈所构成的“双向夹击”。
一边是 LLM、多模态 Agent、连续决策系统的持续演化,不断扩展能力边界;一边是业务场景的真实复杂:人类的需求与反馈,始终定义着技术落地的真实路径。
那么最危险的创业选择,可能是从“中间层”出发。
中间层的工具组件(如总结、问答、轻自动化)虽然看似“通用”,但也最容易被平台系统吞并成一个 API 接口或 UI 包装。一旦平台进化,它们就像浏览器插件一样,被抽象、边缘化、比价化。
从最难的地方打透
才可能拥有系统级护城河
我们选择反向而行——从端的“最远处”往系统推进。
比如健康,它是数字系统的边界,也是最难被标准化的数据世界。越难啃的场景,越可能成为协议级运行时的锚点,也越能先一步积累用户信任 + 合规示范 + 调度惯性。
不是因为它容易,而是因为它难;不是因为它流量大,而是因为它更接近现实真相与系统可信锚点。
在未来万物皆数字化、操作系统人格化的世界里,只要人类的存在还有意义,保持好身体的健康,就是对这个存在意义的尊重。
重定义“入口”:
流量入口 ≠ 数据信任入口
在 LLM-OS 时代,“入口”不再是 UI 图标。
我们追求的不是一个能被用户点击的界面,而是一个能被系统 Agent 持续调用的能力节点——一个默认在线、默认可信、默认参与任务协作的“Skill Capsule”。
这意味着,你的目标不再是获得 DAU,而是成为下述结构中的一环:
护城河不在于清洗和接入数据,而在 Runtime 的接口声明,可被 Agent 调用的“能力胶囊”。
三段式路径:Value ← Data← Trust
我们相信,共识比产品先一步。与其让平台拥有一切,不如把工具、协议与信任交还用户。先有信任,再有数据,才有价值。 这可能是新一代产品的生长逻辑。
用户自管 + 开发者共建可能是最可持续、最合规、也最有生命力的路径。
开发者优先
• 每写一个 Connector 就能看到实时事件流反馈
• 不追求完美,而是追求立竿见影的构建体验
• 文档与代码同权,debug 能力才是开发者社群的通行证
保持可迁移与可退出
• 用户可随时导出数据与微调参数
• 节点自由迁移,无锁仓机制,以信任维系黏性
“打通数据”是必要条件
但不是充分条件
我们当然要“打通从脏数据到净能力的全链路”:
• 汇聚多源健康数据:CGM、ECG、处方、体检报告、饮食卡路里、基因报告、医院检验检查单
• 建立流水线:数据理解 → 实体抽取 → 指标标准化 → 结构化入库
• 构建 AI 可引用的健康事实云盘,让模型 “看见真相”,而非“靠猜”
但我们也要清醒地看到:脏数据清洗 ≠ 护城河
•模型有天然的纠错能力,数据越脏,它越凸显优势
• 大平台拥有端到端闭环,随时能复制你的清洗流程
真正的护城河
是结构化现实的能力
护城河不是你洗了多少数据,而是你是否能持续把现实中的模糊与混乱,转译为系统能够理解与调度的结构化语义,能否把远超模型上下文的散落的个体数据(比如 24 小时 125hz 的 ECG、几千万个点位的基因序列)凝练为当前 query 最简短的上下文。
换句话说,你能否成为模型与真实世界之间的语义编译器?
结语:平行宇宙与反幂律革命
历史从未被写死。
总有一些微小的分岔口,在某个特定的人、特定的事件下,改变了整个世界的走向。
我们正在站在这样的分岔口:一个由算法统治、由 agent 调度、由协议重构的世界正加速靠近。而我们要做的,不是“等待未来”,而是用双手去参与它的生成。去创造,而不是等待改变这个还没有到来的时代。
与 Power Law 对抗:赋能普通人,也成为那个能“看见矩阵”的人
我们所处的系统,是一个典型的幂律宇宙:99% 的流量、注意力、资源被 1% 的入口吞噬。普通人只能在 UI 界面、入口图标间苦苦挣扎。
但真正的游戏在更深层。我们要学习看见底层的「协议-能量-信任」流动。
像 Neo 那样觉醒。Neo 的意义不是“我无敌”,而是他向所有人证明:人人都有“觉醒”的可能。Manifest 的开源、用户参与、共识投票,这些不是“精英特权”,而是公共的“子弹时间”技能包。人人都可以成为 Neo,不靠力量,而靠协议 + 信任 + 自我可证明。
在电影里,人类对抗机器的方法,不是更强的火力,而是“人性 + 选择”。而在现实中,我们用:
• 社区共识,代替单点权力
• 开源协议,取代黑箱垄断
• 责任验证,压制算法幻觉
我们试图构建一个更加公平、可组合、可审计的 Agent 世界 —— 不再是巨头控制所有入口的世界,而是万千开发者在底层协议中共同治理的系统。
未来的挑战,不是有没有能力打破集中式权力,而是——觉醒之后,我们是否能维护一个多元、去中心的系统结构。
这,比子弹时间改写物理规则更难,但也更值得。
感谢你看到这里。
如果你也相信:未来不是图标和 UI,而是协议和信任的共识网络——欢迎一起来共建这片“还未被定义的操作系统”。未来的超级开发者,不是拼部署能力的全栈,而是能写协议、懂信任、把现实结构化的人。
让我们一起,在历史尚未书写完成的地方,种下自己的名字。
欢迎开发者、产品人、AI玩家
加入「智塔 AI 交流群」
共享前沿技术、开源资源等
若二维码过期,请后台私戳小编~
热门跟贴