“计算资源可以在训练和推理之间循环复用,但数据的规模却在无休止地膨胀。”西部数据首席产品官Ahmed Shihab的这句话,戳中了过去两年AI狂飙中一个被严重低估的短板——存储。当GPU一卡难求、智算中心拔地而起时,数据基础设施的失衡正在悄悄卡住AI规模化的脖子。
IDC的预测为这个判断做了注脚:到2029年,全球AI基础设施支出将突破1万亿美元,五年复合增长率约31%,中国市场的这一数字更是达到32.5%。更值得留意的是另一个数据——到2029年,近80%的云端数据仍将存储在HDD上。大模型时代,硬盘非但没有过时,反而成了不可替代的基座。
这种结构性变化,在AI落地最猛烈的几家中国企业身上已经非常具体。阿里云对象存储高级总监罗庆超直言:“存储已经从幕后走向前台,已经不再是配角,它成为AI系统运行的关键环节。” GPU集群规模越来越大,数据吞吐需求飙升,存储系统一旦跟不上,整个万卡集群就只能闲置,带来巨大的成本浪费。这意味着,算力基建的棋局里,存储不再是配角脚本。
比亚迪电子产品总经理崔勇则从智能驾驶的场景给出了一组直观数据——每天产生的新数据接近1PB,甚至若干个PB,而且增长曲线是指数级的。但真正让工程团队焦虑的不是数据量的爆炸,而是流转效率。“全生命周期数据流转效率低,会直接影响AI闭环迭代效率。”从车端采集、清洗、训练,到模型下放、车端推理,每个环节的存储都是割裂的,全靠人工衔接。数据在管道里走得磕磕绊绊,再强的GPU也只能干等。
另一个普遍且更扎心的痛点是冷热数据分层。热数据需要极高的IO性能,但大量实际并不需要高性能的数据仍然堆在昂贵的闪存上,成本居高不下。崔勇用一句大白话道出了所有人的纠结:“最大的挑战是做到又快又便宜,这是最难的。”
这些集中爆发的痛点,解释了为什么在西部数据对全球200家头部客户的调研中,90%的中国受访者将TCO(总体拥有成本)列为HDD的首要优势,更有72.7%的人表示这是他们将HDD纳入长期战略的核心原因。在AI的投入竞赛里,中国企业正在用脚投票,把总成本控制摆在明面上。
面对这些需求,西部数据公开了一份节奏相当密集的产品路线图:2026年实现40TB单盘,2029年达到100TB以上。一年前,100TB还被认为不现实,这次西部数据给出了明确的技术路径——HAMR(热辅助磁记录)技术将单张磁碟容量从约4TB大幅提升至10TB,配合单盘封装14碟,最终跨越100TB门槛。这个跳跃不只是容量数字的变化,更意味着数据中心的存储密度将迎来一次重构。
容量之外,两项面向AI工作负载的针对性技术更让人兴奋。高带宽硬盘技术通过让两个磁头同时读写,将单盘带宽翻倍,解决了容量增加后每TB带宽被稀释的问题,让客户不需要随硬盘升级而修改软件。而双枢轴技术则在硬盘内置双磁臂,顺序IO性能直接翻倍。更妙的是,这两项技术可以叠加使用,且均已进入客户验证阶段,意味着不是PPT规划,而是即将落地的工程方案。
能耗这块也没落下。功耗优化型HDD可在降低20%功耗的同时,将性能代偿控制在5%至10%,并额外附赠约10%的容量提升,计划2027年进入客户认证。对于动辄部署数千块硬盘的超大规模数据中心,乘数效应相当可观。西部数据拿自家产品举例:旧款4TB传统硬盘功耗约2.85W/TB,而现代32TB氦气硬盘已降至约0.3W/TB,降幅超过9倍。每TB能耗踩到十分之一,才是云厂商敢放手扩容的底气。
AI产业的上半场,所有人都在抢算力。但当模型真正跑进生产环境,数据洪流之下,存储正在成为下一道需要硬啃的关卡。从40TB到100TB,从单磁盘到双磁头双磁臂,西部数据画出的这条路线图,或许正是AI下半场基础设施补课的索引。补课,才刚刚开始。
热门跟贴