当"烧token换效率"成为新日常,程序员到底在为什么焦虑?4月17-18日,CSDN与奇点智能研究院把这个问题扔给了60多位全球技术专家——NVIDIA、微软、Google、华为、阿里、腾讯、月之暗面、阶跃星辰、北大、智源——吵了整整两天,答案却比我们想象的更分裂。
一、Agent正在吃掉软件,但没人说得清"怎么吃"
奇点智能研究院院长李建忠开场就扔了一个判断:Agent正在通过"双轮颠覆效应"重写软件产业——既改变软件应用形态(Do What),也颠覆软件开发方式(How Do)。
这话听起来像定论,但接下来的讨论立刻把它拆成了碎片。
荣耀终端AI首席科学家黄非直接泼冷水:单靠模型根本跑不通商业化闭环。他的路径是"模型与系统协同",最终指向"增强人类智能(AHI)"——不是替代人,而是把人放在中心。
蚂蚁集团副总裁周俊的说法更微妙:国内外顶尖厂商在关键问题上"大量非共识并存"。他的原话是,这恰恰构成了AGI时代"比较有趣的地方"——把非共识慢慢做成共识。
上海人工智能实验室陈恺的观察更具体:核心发展方向已转向智能体和长程推理能力的提升。注意这个"转向"——不是"已经达成",是正在调头。
新浪微博首席科学家张俊林在圆桌环节的发言,把这种分裂感推到了台前。五位专家讨论"推理拐点下的Agent产业新生态",表面是共识,实则是五种不同的"拐点"定义:有人看技术成熟度,有人看商业闭环,有人看人机协作边界。
一个细节值得玩味:当李建忠说"双轮颠覆"时,用的是正在进行时;黄非说"AHI"时,用的是未来时;周俊说"非共识"时,用的是现在进行时。三种时态,三种时间尺度,三种对"现在该干什么"的判断。
二、三个发布,三套不同的"解题思路"
大会现场的三项发布,把这种分歧具象成了三条并行的轨道。
第一条轨道是方法论。李建忠与华东师范大学王伟教授联合发布的《AI原生软件研发成熟度模型AISMM白皮书》,试图给混乱的实践一个结构化框架——从研发流程、组织架构、基础设施到工具链,提出可演进、可评估的转型路径。
这很CSDN:先建标准,再谈落地。但标准本身的尴尬在于,它发布的时候,行业可能还没准备好被"标准化"。
第二条轨道是评测体系。《AI大模型技术体系综合开源影响力榜单》设置了53项核心指标,数据来源覆盖17个主流技术平台,采集了13,541条有效链接。四个维度——模型能力、数据体系、评测体系与系统工程——试图建立"可对照、可分析的参照系"。
数字很具体,但问题也很具体:当评测体系本身成为竞争维度,它测的是技术实力,还是工程包装能力?周俊说的"非共识",在评测指标的选择上同样适用——选什么指标,本身就是立场。
第三条轨道是生态构建。「AI DSpace」开发者空间站由多位技术专家以个人名义联合发起,定位"高密度AI开发者社区",试图打通"产业与学术、资深专家与入门开发者之间的断层"。
三条轨道,三种逻辑:第一条想"规范",第二条想"量化",第三条想"连接"。它们互不冲突,但也互不统属——这正是当前AI软件研发领域的真实图景:没有单一主导范式,只有并行实验。
三、分论坛的"技术深井":每个人都在自己的图层上说话
主论坛的宏观判断之后,四个分论坛把话题切进了更具体的图层。但"具体"不等于"收敛",反而暴露了更多断裂。
「大语言模型技术演进」论坛的议题清单读起来像技术栈的横截面:在线策略蒸馏、零样本语音合成、线性注意力、Agent基座模型、推理编译器优化、预训练数据优化、复杂任务建模。新浪微博、微软亚洲研究院、月之暗面、阶跃星辰、腾讯、红帽——每家带来的都是"最新进展与落地思路",但"落地"的场景千差万别。
一个隐含的分野:月之暗面、阶跃星辰谈的是"基座模型"的构建方法,腾讯、红帽谈的是"优化"与"工程化"。前者在探索能力的边界,后者在压缩落地的成本。同一个论坛,两种节奏。
「多模态与世界模型」论坛的议题设置更底层:GPU底层编程、云侧AI全栈规模化落地、高性能推理框架、企业级多模态模型、视频生成到世界模型。NVIDIA、Google Cloud、SGLang社区、蚂蚁集团、昆仑万维——这里的分层更明显:芯片层、框架层、模型层、应用层,每层都有自己的"前沿"。
有意思的是"世界模型"这个词的用法。昆仑万维谈的是"视频生成到世界模型"的技术实践,这是生成式路线;但学界对"世界模型"的另一条理解是认知建模、物理仿真——两种"世界",同一个名字。
「AI原生软件研发与氛围编程」论坛终于碰到了程序员最直接的焦虑。快手、通义实验室、百度、硅心科技的议题包括:AI辅助编码的实践路径、智能体在软件工程中的演进、规模化智能任务构建、企业级高效研发新范式。
"氛围编程(Vibe Coding)"这个词的出现本身就有意味——当AI生成代码成为常态,"编程"的定义正在从"写代码"滑向"调氛围"。快手和百度谈的是"规模化",硅心科技谈的是"演进方向",通义实验室的位置介于两者之间。没有哪家声称已经找到"标准答案"。
「智能体系统与工程」论坛可能是实践密度最高的场域。微信AI搜索Agent的实战落地、DeerFlow 2.0从研究框架到Super Agent运行时的架构重构、桌面Agent重塑全场景生产力、Agent设计模式的系统化总结、可自我增强智能体工程体系——五个议题,五个不同的"Agent"定义。
微信的Agent是搜索场景的垂直优化;DeerFlow 2.0在讲"运行时"的通用性;桌面Agent谈的是跨场景生产力;设计模式总结试图抽象共性;自我增强体系则在挑战"静态Agent"的假设。它们共享"Agent"这个名字,但解决的问题域几乎不重叠。
四、"非共识"背后的真问题:我们到底在争论什么?
两天会议听下来,"非共识"这个词的频度高得反常。但更值得追问的是:这些分歧究竟是技术路线的差异,还是对"问题本身"的定义差异?
第一个断层:Agent的边界在哪里?
李建忠的"双轮颠覆"把Agent当作软件产业的重写者;黄非的"AHI"把Agent当作人的增强工具;微信AI搜索的Agent是一个具体功能模块;DeerFlow 2.0的Agent是一个可扩展的运行时。有人在谈范式转移,有人在谈功能优化——讨论的颗粒度差了一个数量级。
第二个断层:代码生成是终点还是起点?
"氛围编程"的支持者把AI生成代码当作效率的终极解放;反对者(或焦虑者)追问的是:当代码可以被生成,程序员的不可替代性在哪里?但这个问题本身可能设错了前提——如果软件形态正在被重写,"程序员"这个职业定义本身就在变化,争论"还能做什么"可能是在为一个正在消失的身份辩护。
第三个断层:评测体系能消除分歧吗?
53项指标、13,541条链接——榜单的客观性建立在数据规模上,但指标的选择、权重的分配、数据的采集方式,每一步都嵌入主观判断。更根本的是,当技术路线本身存在"非共识"时,统一的评测框架是在促进对话,还是在制造新的霸权?
第四个断层:开源社区能缝合断裂吗?
「AI DSpace」的定位是"连接器",但连接的前提是各方愿意被连接。当大厂有自己的生态闭环、学术界有自己的评价体系、独立开发者有自己的生存逻辑时,"全球AI开发者社区"是一个愿景,还是一个需要持续投入的基础设施项目?
五、一个未被充分讨论的变量:时间压力
所有讨论都隐含一个背景:2026年,推理成本的下降速度、模型能力的迭代速度、竞争格局的变化速度,都在压缩决策窗口。
"烧token换效率"之所以成为选项,是因为token价格在跌;Agent之所以成为入口,是因为模型能力刚好跨过了"能用了"的阈值;非共识之所以"有趣",是因为还没有人被迫出局——但窗口期不会永远敞开。
李建忠说的"双轮颠覆"正在进行时,这个"正在"既是描述,也是催促。黄非说的"模型与系统协同"是路径,但"协同"需要试错周期。周俊说的"非共识做成共识"是过程,但过程的终点可能是分化而非收敛——有些非共识会被证伪,有些会被验证,有些会长期并存。
一个细节:大会标题里的"2026奇点智能技术大会","2026"是年份还是品牌?如果是年份,它暗示了一种紧迫感——在2026年讨论"奇点",意味着认为关键转折就在眼前。如果是品牌,它暗示了一种长期主义——把"奇点"当作持续观察的框架。这个模糊性本身,就是对当前技术节奏的最佳隐喻。
六、给从业者的粗糙建议:选择你的图层,接受不可通约
两天会议的信息密度很高,但可操作的结论很少。这不是批评,是现状。在"非共识"成为常态的阶段,任何"该怎么做"的建议都是过度承诺。
但如果必须提炼,大概是三条:
第一,明确你的图层。GPU编程、框架优化、模型训练、Agent工程、应用落地——每个图层有自己的语言、节奏和成功标准。跨图层对话是必要的,但期待跨图层"共识"是徒劳的。
第二,区分"能用的"和"成熟的"。在线策略蒸馏、零样本语音合成、自我增强智能体——这些技术可能已经在特定场景"能用",但距离"成熟的工程实践"还有距离。评估项目风险时,这个区分很关键。
第三,把"非共识"当作资源而非障碍。周俊说的"比较有趣的地方",换个角度就是差异化竞争的空间。当大厂在卷基座模型时,垂直场景的Agent优化、特定工具链的深耕、细分评测体系的建立,都可能是破局点。
最后,关于那个最焦虑的问题——"程序员还能做什么?"——两天的讨论其实给出了一个隐含的答案:停止以"写代码"定义自己。AI原生软件研发成熟度模型、Agent设计模式、氛围编程——这些新概念指向的是一种新的职业身份:不是代码的生产者,而是智能系统的编排者。这个身份的具体形态还不清晰,但清晰的是,旧身份的辩护成本正在快速上升。
下一步可以做的三件事
如果你在这场"非共识"中找不到位置,试试这三个动作:
第一,下载《AISMM白皮书》,但不要把它当标准,把它当诊断工具——看看你的团队或项目落在哪个成熟度层级,然后决定是补短板还是换赛道。
第二,选一个分论坛的议题清单,挑一个与你当前工作最远的主题,花半天时间读相关论文或技术博客。不是为了转型,是为了建立"相邻图层"的直觉——这种直觉在跨团队协作时意外有用。
第三,如果「AI DSpace」开放注册,先占个坑。社区的价值不在于它承诺什么,而在于它聚集了什么人——在"非共识"阶段,信息优势往往来自连接密度,而非信息本身。
2026年的AI软件研发,没有地图,只有指南针。大会的价值不是提供答案,是把"我们在哪里"这个问题,问得更清楚了一点。
热门跟贴