作者:王聪彬

现在可以和金子对标增值的,那一定是存储。不仅价格持续上行,而且还没有现货,交付周期已经要用年计算。从DRAM到颗粒,再到硬盘和磁带,几乎所有相关存储都面临严重的供给压力。

存储在AI时代,在算力之后也走到了台前。尤其是最近“龙虾”带动的推理爆发,让我们一下进入Token经济时代,数据的增长速度已经发生了质变。

数据的爆发也为企业带来了多重压力,91%以上的CIO已经将其存储改造列为首要议程,运维成本和复杂度作为核心考量;78%以上的企业已意识到仅靠扩容无法满足AI发展需求,必须做到存算协同。

IBM从客户实际使用场景出发,将存储划分为热、温、冷、深冷不同层级,构建覆盖AI全生命周期的存储体系,既支撑传统核心业务,也面向AI负载提供扩展能力。

当AI走向数据,存储成为新的基础设施分水岭

现在企业对存储体系进行的结构性重构,已经变为围绕数据流转效率与全链路协同进行重塑。很多企业开始重视“人工智能工厂”(AI Factory)的概念,他的本质是一个将数据转化为智能的端到端系统,从数据源到AI数据平台,再到智能输出。

像IBM Storage Scale数据平台、IBM Storage Scale System一体机就可以帮助企业构建真正的AI工厂,端到端地处理数据。

为了帮助企业以更低成本、更高效率从海量数据中挖掘价值,GTC 2026大会上,IBM与NVIDIA宣布了新的合作,推动GPU原生数据分析、智能文档处理、本地及受监管环境的基础设施部署。

NVIDIA选用了IBM存储方案,为GPU原生高级分析引擎供给海量数据:IBM Storage Scale System 6000可提供高达10PB的高性能存储,将IBM的统一数据访问层及大规模并行吞吐能力,与NVIDIA的GPU流水线深度整合。

‌窥一斑就可知全豹,IBM能够提供的是端到端、高性能、稳定的数据存储服务。

“不同业务、不同负载对存储的诉求截然不同,延迟、吞吐、成本、合规,优先级各不相同。”IBM大中华区存储事业部总经理吴磊说道。

打开网易新闻 查看精彩图片

IBM大中华区存储事业部总经理吴磊

以传统金融为例,AI已经被用于反欺诈场景,过去信用卡被盗刷,往往要两天后才接到通知,今天则可以在分钟级完成识别。背后的关键在于,模型与主机的深度耦合,在刷卡瞬间完成判断,而不是事后再去追溯与取证,从源头减少损失。

到了训练环节,大模型已经进入万卡级集群时代,GPU投资动辄数亿甚至数十亿,哪怕1%的闲置,都意味着上亿元的浪费。如果训练进行了数小时,却在落盘阶段受阻,导致checkpoint无法写入,那么前序算力投入将被直接打水漂。

而且合规要求正在变得愈发严格,当大模型推理、决策时,结果必须具备可回溯性,这也对数据治理与存储体系提出了更高要求。最后,银行的数据需要长期保存,存放在闪存或硬盘上并不现实,综合来看,磁带依然是最具性价比与安全性的长期存储方案。

对比过去,数据更多是通过副本拷贝实现,但当数据规模上升到100TB、PB级甚至更高时,多次复制导致存储成本提升;人工智能复制数据会导致数据安全问题,企业需要有多套监管软件、安全软件来管理数据;在千卡、万卡集群中,高速网络本身已经非常昂贵,如果再叠加大量副本传输,对带宽和交换能力提出更高要求,成本会被进一步放大;当副本数量持续增加,数据本身会变得难以管理。

所以IBM认为,未来的AI时代应该是让人工智能走向数据。

AI时代的存储体系长什么样?又该如何建?

IBM商业价值研究院年初的一项调研显示:76%的CEO认为企业现有IT架构足以支撑发展;但在CIO层面,情况明显不同,16%的CIO认为企业架构已严重落后于AI需求,43%的CIO处于明显的焦虑之中。

IBM中国区存储业务销售总经理金鑫在过去一年与客户的接触中感受到他们正面临五大挑战:

第一,安全风险持续上升。勒索软件与网络攻击频发,威胁企业业务连续性;

第二,电力限制。不少用户的私有云机房里,机柜实际只装了1/2甚至1/3,本质是供电能力约束。如果机房在城区,一个T42机柜通常只能承载6到7千瓦,再往上电力就难以支撑;

第三,运维水平。企业现有IT架构大多是多厂商、多产品组成,CIO需要团队同时掌握不同产品体系,同时私有云、多云环境,整体运维压力显著上升;

第四,AI创新带压力。一些企业明显处于被动投入,不知如何推进AI,进一步加剧了焦虑,目前只有约一半的CIO做AI之前会先完成数据治理。

第五,成本高。一方面是存储等产品价格上涨,另一方面是企业本身IT支出占比就较低,多重投入之下,成本压力更加明显。

打开网易新闻 查看精彩图片

IBM中国区存储业务销售总经理金鑫

IBM在其中能做些什么?早在75年前,IBM就已进入磁带这一数字存储领域,甚至早于IBM主机。阿波罗登月任务期间,IBM负责了相关IT建设,其中,3次任务共累计收集173卷磁带数据,但这些数据在当时并未被深入分析。多年之后,当NASA要重新挖掘这批历史数据时,依然能从磁带中成功恢复出数十年前的数据。

过去70多年里,IBM一直在存储领域持续创新。进入人工智能时代,其提出的核心思路是:让人工智能走向数据,而不是让数据走向人工智能。

围绕这一理念,IBM构建了一套覆盖AI全生命周期的存储家族,底层弹性存储,侧重节能环保、长期安全的数据的二级存储,包括IBM 磁带/IBM Archive归档软件;中间层核心存储,包括适合企业级混合云IBM FlashSystem、IBM Fusion;上层AI存储高性能,包括IBM Storage Scale和IBM Storage Ceph。

“通过基于策略实现自动化的数据分层和迁移,企业可以在不同存储层之间实现数据的有序流动,在性能、成本与效率之间取得平衡。”吴磊强调。

国内一家头部智能驾驶芯片企业采用了IBM的整体解决方案,不仅在本地数据中心部署,还在北京、上海的研发与生产基地,实现数据的统一管理,提升产研效率,同时降低存储与网络传输成本。

当“数字自主”成为主流,存储正在换一套逻辑

闪存和AI可以说是天生一对,AI工作负载对存储提出了,超高的数据吞吐量、更低的访问延迟、支持频繁的读写操作的要求。

市场侧给出了明显的反馈。CFM闪存市场最新数据显示,2025年四季度全球DRAM/NAND Flash市场规模达755.1亿美元,环比增长29.2%,其中全球NAND市场规模环比增长27.8%至235.45亿美元。

IBM也在今年第一季度发布了嵌入AI智能体的下一代闪存系统IBM FlashSystem,实现持续性的数据保护、主动的威胁分析和定制化的恢复建议,重新定义企业级 IT 弹性。

为何要选择下一代闪存系统IBM FlashSystem,最重要的一个理由就是FlashSystem上的FlashSystem.ai智能体,可以通过无缝、自助式的操作,帮助管理员管理、监控、诊断和修复整个数据路径上的故障和风险。

FlashSystem.ai平台的AI模型由高质量的数据训练而成,包括高级遥测技术收集的数百亿数据点以及多年的真实运营数据,每天可执行数千个自动决策,无需人工监督。“FlashSystem.ai是一个用不休息的存储管理员,可以做概述、零点击配置、创建和更新。”金鑫说道。更关键的问题是它不能做什么,比如

FlashSystem.ai具备了保护、适应和执行能力。首先,人机协作与强化专家经验及认知。系统部署大约两小时后,便会开始学习所在环境,逐步理解企业存储的内容、应用类型和负载特征。相比过去单纯追求IOPS的存储系统,这一代产品更强调对业务环境的理解,并给出配置建议。用户可以通过自然语言进行确认或调整,在持续交互中完成优化,同时系统也会基于资深管理员的反馈不断学习。

其次,是主动优化能力。以FCM为例,其可与FlashSystem.ai协同,根据数据规模和业务负载动态调整运行模式,在业务高峰来临前转为高性能模式,实现资源的前置调优,让IT从被动排障转向主动创新。

第三,是情境感知安全能力。情境感知技术在IBM的技术体系中已发展多年,与AI结合后,可以在秒级识别IO异常。针对勒索软件写入时特有的IO特征,系统能够快速感知并触发告警,及时采取防护措施。

最后,是合规与动态响应能力。AI时代数据的流动更加频繁,也带来更复杂的合规要求。FlashSystem.ai内置相关功能,可自动生成审计报告,帮助企业降低合规风险,同时显著减少人工工作量。

IBM FlashSystem另一个重要更新是第五代 FlashCore Module(FCM5),其内置了一颗IBM自研芯片,主要用于压缩、去重和加密等操作。

硬压缩可以实现最高约1:5的压缩比,例如一块100GB的盘,在开启压缩后可承载约500GB的数据。以更小的外形尺寸提供了更大的容量,支持基于硬件的重复数据删除和压缩。革命性的硬件驱动器级智能,提供真正的计算存储和量子安全硬件加密。

根据内部测试,借助内置芯片对数据进行优化排列,整盘的使用寿命较普通NVMe可提升约57%。

在国内,电子、制造行业对IBM FlashSystem的兴趣相对较高,究其原因主要在于这些行业系统复杂,对存储高可用、安全要求高,且运维人员资源相对有限。一家华东半导体企业处于产能爬坡阶段,内部混用4家不同品牌的存储产品,存在明显的数据竖井。IBM从IOPS入手进行梳理,通过引入IBM FlashSystem与磁带库,解决了双活架构下的性能与数据保存问题。

“拎着锤子找钉子”的状态,对于企业而言并不在少数。对于IBM而言,这一轮AI浪潮既是压力,也是重构基础设施的窗口,借此构建一套更灵活、弹性、可扩展的基础架构。

说到底AI时代对存储的核心要求无外乎三点:一是能够在检查点将数据快速落盘,避免高成本算力被浪费;二是能够支撑万级节点规模并具备动态伸缩能力;三是在完整的AI管道中,让数据以安全、可靠且可控成本的方式流动。

几十年来,IBM始终保留命令行这一高效、简单的操作模式。在AI时代,这种能力反而被进一步放大。在这样的基础上,在Agentic AI时代,企业可以通过智能体直接高效地对IBM的高端、中端、低端硬件和软件进行操作,真正做到让人工智能走向数据。