整理 | 梦依丹
出品 | CSDN(ID:CSDNnews)
你花了数千万美金买回最顶级的 H100 集群,指望它们跑出惊人的 Agent 响应速度。但现实是:每块价值 4 万美金的算力怪兽,大部分时间竟都在闲置,只为了等那该死的磁盘 I/O。
在 ASPLOS 2026 上,Eunomia-BPF 团队对 144 个 SWE-bench 任务的全链路 Profiling 揭露了一个被忽视的真相:
在复杂 Agent 任务中,大家死磕的大模型推理仅占耗时的 30%-40%。剩下的 60%-70%,全被虚耗在了操作系统的执行环节——环境初始化、文件读写、多步骤切换带来的系统级开销。
论文地址: https://os-for-agent.github.io/papers/AgenticOS_2026_paper_10.pdf
Profiling 数据进一步揭示了“算力自相矛盾”的尴尬现状:
Agent 运行时,平均 CPU 利用率甚至不到 12.8%,处于严重的“出工不出力”状态;但在执行复杂指令(如安装环境、跑测试)的瞬间,内存和网络带宽的峰值消耗能飙升至平均值的 15 倍以上。
这种“极低均值”与“极高瞬时脉冲”的剧烈撕裂,证明了传统的静态资源分配模式在 Agent 时代已经失效。
Agent 的性能瓶颈则是在执行任务时,基础设施层的“手脚”配合,而非推理速度。
面对这场架构级的范式转移,由 CSDN 与奇点智能研究院联合主办的 「2026 奇点智能技术大会」,特别设立了「AI Infra 基础设施与运维」专题,邀请了来自 NVIDIA、华为、智源、无问芯穹、清程极智、启元实验室、昆仑芯、清微智能等 8 位一线“基建专家”,为大家带来 Agent 时代的基建实战。
既然人脑无法实时响应 Agent 这种毫秒级的资源跳变,那就用 Agent 来管理集群。
无问芯穹技术副总裁吴保东将带来《基于 Agentic Infra 的 AIOps 智能体系统》。他将拆解如何利用专项智能体实现跨集群的感知与自动治理,将平均故障修复时间(MTTR)降低 90% 以上,让运维从“被动响应”转向“主动进化”。
清程极智副总裁何万青带来《Agentic AI Infra:以智能体为中心的八卦炉智能软件栈》,深度探讨如何构建一套真正适配长程 Agent 任务流、而非单纯适配模型推理的底层架构。
针对“大模型推理仅占 30%”的尴尬现状,我们需要在剩下的 70% 里硬抢效率,为此我们邀请到:
昆仑芯推理框架架构师马阳,他将复盘《大规模 LLM 推理优化》,分享支撑文心一言背后,如何解决显存墙与带宽墙、实现极致吞吐的真实心得。
华为研发工程师、OmnInfer 负责人何斌将带来《Omni-infer 性能极致优化实践》,从底层指令集到上层算子融合,演示如何通过硬核手段榨干每一比特的算力红利。
不同芯片、不同软件栈导致的适配成本高昂,是每一个开发者最头疼的阻碍。
北京智源 AI 框架研发负责人敖玉龙将分享《基于 FlagOS 技术栈的大模型框架多芯片统一高效插件体系》他将演示如何以低侵入方式,将统一算子接入 Megatron-LM、vLLM 等主流框架,让同一套代码在不同国产芯片上零成本迁徙,实现“一次开发,多芯运行”。
启元实验室数据智能团队负责人马少楠则聚焦“九源智能基础软件栈”,分享《面向大模型时代的软硬协同计算架构与数智融合实践》通过统一加速平台屏蔽异构芯片差异,打通从底层数据处理、知识库构建到智能化分析的全链路技术脉络。
AI 时代的 Infra 不再是简单的硬件堆砌,而是一个复杂的软件定义系统。
NVIDIA 产品管理高级总监 Han Vanholder将带来全球视角的《开源 AI 工厂软件:NVIDIA 云合作伙伴如何构建与规模化运营 GPU 基础设施》。他将介绍 NVIDIA 如何通过 NCX(NVIDIA Cloud Accelerator) 将大规模运营经验转化为可部署的模块化组件,帮助云厂商构建真正的生产级 AI 基础设施。
清微智能技术专家楼群芳将探讨《可重构计算超节点的理论探索和实践》。她将解析如何通过硬件可重构性与智能资源动态编排,构建像“变形金刚”一样能动态适应多变算法需求的智能计算系统。
此外,沐曦高级副总裁孙国梁也将现身专题圆桌,与多位技术决策者共同探讨国产算力在智能体时代的生态突围之路。
本场专题听众收益:
这是一场属于 Infra 架构师与集群负责人的“全景实战复盘”。你将带走的不仅是几页 PPT,而是一套应对 2026 版算力焦虑的系统解法:
掌握适配标准:了解如何通过插件化体系实现多芯片的高效运行;
获取压榨心法:学习在大厂国民级业务中验证过的推理加速策略;
对齐全球趋势:看清 NVIDIA 与国内顶尖实验室对“AI 工厂”与“可重构计算”的最新定义。
4 月 17-18 日,上海。
来现场,和最懂底层工程的一线专家们一起,给你的 AI 系统换上一套“强壮的底盘”。
席位有限,立即扫码锁定早鸟票,抢占 2026 AI 基建红利!
热门跟贴