AI烧了18个月钱后，Tintri把存储成本砍了47%的骚操作|介质|存储成本|自适应|虚拟机|负载

2024年全球企业在AI基础设施上的支出同比暴涨47%，但一个尴尬的事实是：超过60%的算力在空转。Tintri高级副总裁Phil Trickovic在KubeCon EU上甩出一组数据——他们的自适应分层技术让客户在同等性能下减少了近一半的存储开销。这不是魔法，是把2011年的老技术重新做了一遍。

当年分层只会在SSD和机械盘之间搬数据，现在是在NVMe和SSD之间做动态调度。AI训练产生的海量中间数据不再需要全塞到最贵的存储介质里，系统自己知道该把什么留在高速层、什么踢去冷存储。

Trickovic打了个比方：传统的分层存储管理（HSM）就像公寓楼里每户各自装电表，但没人管整栋楼的变压器负荷。"HSM的问题在于，它根本不知道隔壁'X'工作负载在吃什么资源。"Tintri从第一天就盯上了这个盲区——他们的"特殊酱料"是让每个工作负载的资源伸缩都不打扰邻居。

这套逻辑在x86环境里尤其值钱。Trickovic见过太多企业按"我觉得我需要"来规划基础设施，结果要么堆出一堆闲置容量，要么在业务高峰时集体抓瞎。Tintri的做法是分析工作负载实际在干什么、保留历史轨迹、预测未来需求。输入"我想让业务增长7%"或者"工作负载农场扩2%"，回车——系统会吐出网络、计算、存储各自需要补多少。

从"搬家"到"调度"：分层的两次进化

2011年Tintri刚出道时，存储分层还是个体力劳动。管理员得手动设定策略：热数据上SSD，冷数据下机械盘。那时候AI还没成为基础设施的吞金兽，企业对付的是虚拟机 sprawl（蔓延）——一台物理机上疯长的虚拟机实例。

现在的局面完全不同。大模型训练会产生大量检查点（checkpoint）数据，这些文件体积庞大、访问模式诡异：刚写入时被频繁读取，几小时后可能再无人问津，但万一训练崩溃又得秒级恢复。传统的"热-温-冷"三级模型在这种波动面前形同虚设。

Tintri的新功能把分层粒度做到NVMe和SSD之间。这意味着工作负载不必被"降级"到机械盘，而是在两种固态介质之间动态漂流。Trickovic强调，这对AI场景至关重要："这些系统生成的数据量被严重低估。我们确保你用于额外训练的数据集，始终停留在成本效益最优的介质上。"

Platform9合作：HCI的"预组装"逻辑

过去18个月，Tintri和Platform9 Systems绑在一起搞集成栈。目标是把超融合基础设施（HCI）以更省事的方式推向市场。Trickovic透露，这套方案同时覆盖英特尔和AMD的芯片组，" bolted, validated, certified and supported by both companies"——两家公司的认证和支持全包。