6月25日,在昨日举办的联想问天品牌焕新暨算力生态大会的媒体专访环节,联想中国基础设施业务群战略总监黄山面对多家主流科技媒体的提问,系统性地阐述了联想对于AI算力基础设施的最新思考。针对AI从通用算力向“Token工厂”演进的趋势,黄山提出,算力竞争已进入深水区,核心在于通过系统性工程能力补齐产业落地的短板。

面对AI产业从“卖算力”向“卖Token”的商业范式转变,黄山指出,单纯以PetaFLOPS为单位的算力租赁已难以为继,客户更关注单位Token的生成成本与服务质量。为此,联想提出了构建“Token工厂”的五大短板补齐策略,核心在于通过“六大工艺”实现算力的极致优化。

在硬件载体层面,联想通过超节点技术的迭代,将800伏垂直供电、全冷板液冷等创新技术落地,显著降低能耗与散热成本。在计算工艺层面,重点突破芯模编译优化、通信库重构与集群路由改造,旨在将百万Token的硬件成本控制在1元人民币以内。针对推理场景的瓶颈,联想特别强化了缓存工艺(KV Cache命中优化)与容错工艺(推理池容错与训练MFU提升),确保在大规模集群中维持高可用性。

面对AI模型与应用层的快速迭代,黄山强调“硬件敏捷化”与“软件生态化”的双轨并行。联想不仅通过万全异构智算平台实现了对主流GPU的软硬协同优化,更将生态合作延伸至数据治理与安全合规领域。

在数据治理方面,联想联合诺谛等伙伴,聚焦制造业FDE模式,解决AI落地的数据清洗与标注难题;在安全合规方面,与火山引擎深度合作,开发能够抵御高强度攻击的私有化安全方案,确保企业级AI应用的数据主权与模型安全。这种从底层算力到上层应用的全栈布局,使得联想能够为企业提供从“算力底座”到“Token经营”的完整解决方案。

黄山的观点揭示了AI基础设施的未来方向:算力将不再是孤立的硬件产品,而是集成了先进工艺、优化算法与生态服务的综合生产力工具。联想通过“稳态+敏态”的混合研发模式,在保持通用服务器稳健迭代的同时,以敏捷开发应对AI硬件的快速变化,这种灵活性使其在应对国产GPU多样化、模型架构不确定性的挑战时更具优势。

从“堆砌算力”到“精算Token”,联想正试图通过技术工艺的革新与生态边界的拓展,重新定义AI时代的基础设施标准。这不仅是对算力密度的物理突破,更是对AI产业化落地方法论的深度探索。(袁雪丽)