中经记者 郑瑜 南京报道

随着人工智能浪潮从单一算法工具演变为重塑世界的底层逻辑,算力紧缺与应用效率的矛盾已成为制约产业深耕的瓶颈。

2026年3月22日,在南京举行的“人工智能趋势洞察论坛”上,多位专业人士针对大模型推理技术的突破以及自主智能体生态展开研讨。

《连线》杂志创始主编凯文·凯利(Kevin Kelly)指出,过去八十年被认为难以实现突破的神经网络,在大语言模型出现后迅速验证了可行性;语言成为提升AI能力的关键路径,以及单纯扩大规模即可带来性能提升,同样出乎业界预料。“AI并没有以我们预想的方式工作,受到影响的第一批人不是医生和翻译,而是软件程序员。”他表示,前方仍有高度不确定性,但不确定性本身也意味着机会。

与此同时,AI能力的快速扩张也带来了现实层面的压力——算力供需缺口正在持续扩大。

中国工程院院士、清华大学计算机系教授郑纬民指出,从去年下半年开始,算力需求呈爆发式增长,供不应求已成常态。他表示,大模型推理对显卡矩阵运算和内存读写速度有着极高要求。

以技术创新降成本

围绕AI如何重构产业,长江商学院终身教授、AI数字化转型中心主任孙天澍表示,智能体是下一代产业的组织单元。他认为,千行百业都需要培养自己的“AI架构师”,用智能体去架构下一代产业。

针对推理成本问题,郑纬民详细介绍了Mooncake(以下简称“月饼”)架构与分布式推理两项关键技术。其中,“月饼”架构的核心在于实现相同内容的缓存共享,从而大幅节省内存空间;而分布式推理技术则通过优化存储分布,实现用单块显卡运行满血版(指产品以官方最高规格全功能运行)大模型,显著降低了硬件门槛。

“通过开源的力量,助推大模型推理成本降低。原来任务一多系统就容易崩溃,现在通过技术手段,在降低成本之外,还增加了稳定性。”郑纬民表示。

在传统推理模式下,算力需求爆发导致硬件压力剧增,如何在大模型推理环节实现“减负”成为关键。

“从去年下半年开始,AI算力供不应求。今年开始,由于大模型推理的需求,算力又有了爆发性增长。”郑纬民表示。

“通过开源的力量助推大模型推理成本的降低。原来可能并发多一点就死了,现在通过‘月饼’节省了内存,成本就降低了。”郑纬民说道。

中国通信学会人工智能技术与应用专委会主任、中国移动科学技术委员会副主任高同庆指出,AI正处于从推理优化向智能代理时代的演进中。他提出了“智能体摩尔定律”,即人工智能?体完成任务的时长平均每7个月翻一倍,处理任务的复杂程度正在迅速提升。

有望帮助企业实现效能重构

高昂的启动成本与回报率的不确定性,是企业规模化应用AI的主要挑战。

通过“技术平权”与智能体架构,有望大幅降低企业的应用门槛。

据郑纬民透露,‘月饼’技术已成为当前主要的推理架构之一,帮助多个公司在不扩充硬件的前提下增加Token产出,实现“省钱、好用”。

在企业组织形式上,孙天澍认为,AI不再是人的辅助工具,而是智能本身。“如果企业多出100万个免费的AI博士员工,组织的形态、商业模式、生态关系应该怎么变化?这是企业家应该思考的问题。”

市场主体也在加速产品侧创新落地。在论坛上,诚迈科技(300598.SZ)发布了基于OpenClaw(龙虾)的开源智能体产品,推出诚迈悟空App、“龙宫”平台与“龙盒”硬件,旨在通过自驱动架构与分布式部署,突破大模型从对话向自主执行升级的瓶颈。

据诚迈科技董事长王继平介绍,诚迈科技此前在智能手机、智能网联汽车、信创及开源生态等领域具有多年布局经验。高算力的“龙盒”可以为企业提供本地化、私有化的智能体运行环境,防止信息泄露并节省Token费用。

业内人士认为,智能体生态的完善将加速AI在垂直行业的升级。高同庆提到,在编程领域,AI已能实现传统方式1/8的成本。

孙天澍建议,企业应优先关注“三多一高一复杂”的业务场景进行重构。“CEO必然是总架构师,选对场景,做对架构,先成就AI,再让AI成就你。”

(编辑:李晖 审核:何莎莎 校对:翟军)