60位专家吵了两天，AI编程的共识还是没达成？|agent|ai编程|周俊|智能体|电子表格|程序员

当"烧token换效率"成为新日常，程序员到底在为什么焦虑？4月17-18日，CSDN与奇点智能研究院把这个问题扔给了60多位全球技术专家——NVIDIA、微软、Google、华为、阿里、腾讯、月之暗面、阶跃星辰、北大、智源——吵了整整两天，答案却比我们想象的更分裂。

一、Agent正在吃掉软件，但没人说得清"怎么吃"

奇点智能研究院院长李建忠开场就扔了一个判断：Agent正在通过"双轮颠覆效应"重写软件产业——既改变软件应用形态（Do What），也颠覆软件开发方式（How Do）。

这话听起来像定论，但接下来的讨论立刻把它拆成了碎片。

荣耀终端AI首席科学家黄非直接泼冷水：单靠模型根本跑不通商业化闭环。他的路径是"模型与系统协同"，最终指向"增强人类智能（AHI）"——不是替代人，而是把人放在中心。

蚂蚁集团副总裁周俊的说法更微妙：国内外顶尖厂商在关键问题上"大量非共识并存"。他的原话是，这恰恰构成了AGI时代"比较有趣的地方"——把非共识慢慢做成共识。

上海人工智能实验室陈恺的观察更具体：核心发展方向已转向智能体和长程推理能力的提升。注意这个"转向"——不是"已经达成"，是正在调头。

新浪微博首席科学家张俊林在圆桌环节的发言，把这种分裂感推到了台前。五位专家讨论"推理拐点下的Agent产业新生态"，表面是共识，实则是五种不同的"拐点"定义：有人看技术成熟度，有人看商业闭环，有人看人机协作边界。

一个细节值得玩味：当李建忠说"双轮颠覆"时，用的是正在进行时；黄非说"AHI"时，用的是未来时；周俊说"非共识"时，用的是现在进行时。三种时态，三种时间尺度，三种对"现在该干什么"的判断。

二、三个发布，三套不同的"解题思路"

大会现场的三项发布，把这种分歧具象成了三条并行的轨道。

第一条轨道是方法论。李建忠与华东师范大学王伟教授联合发布的《AI原生软件研发成熟度模型AISMM白皮书》，试图给混乱的实践一个结构化框架——从研发流程、组织架构、基础设施到工具链，提出可演进、可评估的转型路径。

这很CSDN：先建标准，再谈落地。但标准本身的尴尬在于，它发布的时候，行业可能还没准备好被"标准化"。

第二条轨道是评测体系。《AI大模型技术体系综合开源影响力榜单》设置了53项核心指标，数据来源覆盖17个主流技术平台，采集了13,541条有效链接。四个维度——模型能力、数据体系、评测体系与系统工程——试图建立"可对照、可分析的参照系"。

数字很具体，但问题也很具体：当评测体系本身成为竞争维度，它测的是技术实力，还是工程包装能力？周俊说的"非共识"，在评测指标的选择上同样适用——选什么指标，本身就是立场。

第三条轨道是生态构建。「AI DSpace」开发者空间站由多位技术专家以个人名义联合发起，定位"高密度AI开发者社区"，试图打通"产业与学术、资深专家与入门开发者之间的断层"。

三条轨道，三种逻辑：第一条想"规范"，第二条想"量化"，第三条想"连接"。它们互不冲突，但也互不统属——这正是当前AI软件研发领域的真实图景：没有单一主导范式，只有并行实验。

三、分论坛的"技术深井"：每个人都在自己的图层上说话

主论坛的宏观判断之后，四个分论坛把话题切进了更具体的图层。但"具体"不等于"收敛"，反而暴露了更多断裂。

「大语言模型技术演进」论坛的议题清单读起来像技术栈的横截面：在线策略蒸馏、零样本语音合成、线性注意力、Agent基座模型、推理编译器优化、预训练数据优化、复杂任务建模。新浪微博、微软亚洲研究院、月之暗面、阶跃星辰、腾讯、红帽——每家带来的都是"最新进展与落地思路"，但"落地"的场景千差万别。

一个隐含的分野：月之暗面、阶跃星辰谈的是"基座模型"的构建方法，腾讯、红帽谈的是"优化"与"工程化"。前者在探索能力的边界，后者在压缩落地的成本。同一个论坛，两种节奏。

「多模态与世界模型」论坛的议题设置更底层：GPU底层编程、云侧AI全栈规模化落地、高性能推理框架、企业级多模态模型、视频生成到世界模型。NVIDIA、Google Cloud、SGLang社区、蚂蚁集团、昆仑万维——这里的分层更明显：芯片层、框架层、模型层、应用层，每层都有自己的"前沿"。

有意思的是"世界模型"这个词的用法。昆仑万维谈的是"视频生成到世界模型"的技术实践，这是生成式路线；但学界对"世界模型"的另一条理解是认知建模、物理仿真——两种"世界"，同一个名字。

「AI原生软件研发与氛围编程」论坛终于碰到了程序员最直接的焦虑。快手、通义实验室、百度、硅心科技的议题包括：AI辅助编码的实践路径、智能体在软件工程中的演进、规模化智能任务构建、企业级高效研发新范式。

"氛围编程（Vibe Coding）"这个词的出现本身就有意味——当AI生成代码成为常态，"编程"的定义正在从"写代码"滑向"调氛围"。快手和百度谈的是"规模化"，硅心科技谈的是"演进方向"，通义实验室的位置介于两者之间。没有哪家声称已经找到"标准答案"。

「智能体系统与工程」论坛可能是实践密度最高的场域。微信AI搜索Agent的实战落地、DeerFlow 2.0从研究框架到Super Agent运行时的架构重构、桌面Agent重塑全场景生产力、Agent设计模式的系统化总结、可自我增强智能体工程体系——五个议题，五个不同的"Agent"定义。

微信的Agent是搜索场景的垂直优化；DeerFlow 2.0在讲"运行时"的通用性；桌面Agent谈的是跨场景生产力；设计模式总结试图抽象共性；自我增强体系则在挑战"静态Agent"的假设。它们共享"Agent"这个名字，但解决的问题域几乎不重叠。

四、"非共识"背后的真问题：我们到底在争论什么？

两天会议听下来，"非共识"这个词的频度高得反常。但更值得追问的是：这些分歧究竟是技术路线的差异，还是对"问题本身"的定义差异？

第一个断层：Agent的边界在哪里？

李建忠的"双轮颠覆"把Agent当作软件产业的重写者；黄非的"AHI"把Agent当作人的增强工具；微信AI搜索的Agent是一个具体功能模块；DeerFlow 2.0的Agent是一个可扩展的运行时。有人在谈范式转移，有人在谈功能优化——讨论的颗粒度差了一个数量级。

第二个断层：代码生成是终点还是起点？

"氛围编程"的支持者把AI生成代码当作效率的终极解放；反对者（或焦虑者）追问的是：当代码可以被生成，程序员的不可替代性在哪里？但这个问题本身可能设错了前提——如果软件形态正在被重写，"程序员"这个职业定义本身就在变化，争论"还能做什么"可能是在为一个正在消失的身份辩护。

第三个断层：评测体系能消除分歧吗？

53项指标、13,541条链接——榜单的客观性建立在数据规模上，但指标的选择、权重的分配、数据的采集方式，每一步都嵌入主观判断。更根本的是，当技术路线本身存在"非共识"时，统一的评测框架是在促进对话，还是在制造新的霸权？

第四个断层：开源社区能缝合断裂吗？

「AI DSpace」的定位是"连接器"，但连接的前提是各方愿意被连接。当大厂有自己的生态闭环、学术界有自己的评价体系、独立开发者有自己的生存逻辑时，"全球AI开发者社区"是一个愿景，还是一个需要持续投入的基础设施项目？

五、一个未被充分讨论的变量：时间压力

所有讨论都隐含一个背景：2026年，推理成本的下降速度、模型能力的迭代速度、竞争格局的变化速度，都在压缩决策窗口。

"烧token换效率"之所以成为选项，是因为token价格在跌；Agent之所以成为入口，是因为模型能力刚好跨过了"能用了"的阈值；非共识之所以"有趣"，是因为还没有人被迫出局——但窗口期不会永远敞开。

李建忠说的"双轮颠覆"正在进行时，这个"正在"既是描述，也是催促。黄非说的"模型与系统协同"是路径，但"协同"需要试错周期。周俊说的"非共识做成共识"是过程，但过程的终点可能是分化而非收敛——有些非共识会被证伪，有些会被验证，有些会长期并存。

一个细节：大会标题里的"2026奇点智能技术大会"，"2026"是年份还是品牌？如果是年份，它暗示了一种紧迫感——在2026年讨论"奇点"，意味着认为关键转折就在眼前。如果是品牌，它暗示了一种长期主义——把"奇点"当作持续观察的框架。这个模糊性本身，就是对当前技术节奏的最佳隐喻。

六、给从业者的粗糙建议：选择你的图层，接受不可通约

两天会议的信息密度很高，但可操作的结论很少。这不是批评，是现状。在"非共识"成为常态的阶段，任何"该怎么做"的建议都是过度承诺。

但如果必须提炼，大概是三条：

第一，明确你的图层。GPU编程、框架优化、模型训练、Agent工程、应用落地——每个图层有自己的语言、节奏和成功标准。跨图层对话是必要的，但期待跨图层"共识"是徒劳的。

第二，区分"能用的"和"成熟的"。在线策略蒸馏、零样本语音合成、自我增强智能体——这些技术可能已经在特定场景"能用"，但距离"成熟的工程实践"还有距离。评估项目风险时，这个区分很关键。

第三，把"非共识"当作资源而非障碍。周俊说的"比较有趣的地方"，换个角度就是差异化竞争的空间。当大厂在卷基座模型时，垂直场景的Agent优化、特定工具链的深耕、细分评测体系的建立，都可能是破局点。

最后，关于那个最焦虑的问题——"程序员还能做什么？"——两天的讨论其实给出了一个隐含的答案：停止以"写代码"定义自己。AI原生软件研发成熟度模型、Agent设计模式、氛围编程——这些新概念指向的是一种新的职业身份：不是代码的生产者，而是智能系统的编排者。这个身份的具体形态还不清晰，但清晰的是，旧身份的辩护成本正在快速上升。

下一步可以做的三件事

如果你在这场"非共识"中找不到位置，试试这三个动作：

第一，下载《AISMM白皮书》，但不要把它当标准，把它当诊断工具——看看你的团队或项目落在哪个成熟度层级，然后决定是补短板还是换赛道。

第二，选一个分论坛的议题清单，挑一个与你当前工作最远的主题，花半天时间读相关论文或技术博客。不是为了转型，是为了建立"相邻图层"的直觉——这种直觉在跨团队协作时意外有用。

第三，如果「AI DSpace」开放注册，先占个坑。社区的价值不在于它承诺什么，而在于它聚集了什么人——在"非共识"阶段，信息优势往往来自连接密度，而非信息本身。

2026年的AI软件研发，没有地图，只有指南针。大会的价值不是提供答案，是把"我们在哪里"这个问题，问得更清楚了一点。