上周一个金融客户找到我,说系统要做DR方案。聊了三轮才发现,他要的其实是HA——这两个缩写差一个字母,预算差出去两百万。

DR是灾难恢复(Disaster Recovery),HA是高可用(High Availability)。听起来像近亲,实际是完全不同的产品逻辑。HA解决的是"服务器挂了秒切备机",DR解决的是"整栋楼炸了怎么恢复业务"。一个按分钟算RTO,一个按小时算RPO。

这客户的情况是典型的混淆:核心交易系统要求99.99%可用,这属于HA的战场。但他被供应商塞了一套异地容灾方案,每年多付一百多万托管费,故障切换还要人工审批——HA的痛点一个没解决,DR的能力又用不上。

「我们以为买了双保险,结果是买了辆消防车来当救护车用。」这是客户IT负责人的原话。更麻烦的是合同已经签了三年,现在想改架构,违约金又是一笔。

这种错位在B端采购里不算少见。销售喜欢推DR,因为客单价高、实施周期长;客户自己也搞不清SLA和RTO的区别,招标文件里两个词混着写。最后验收的时候才发现,要的秒级切换变成了小时级,业务高峰期根本扛不住。

现在这客户正在跟供应商谈判,想把DR降级成HA,省下的钱够养两个运维团队。他跟我说,下次写需求文档,一定先把缩写全称打出来——至少让销售没法装傻。