打开网易新闻 查看精彩图片

一个10人工程团队,每月在控制平面上白扔2920美元。没人告诉他们这件事。

2026年管理型Kubernetes(容器编排平台)的成本对比,正在颠覆很多人的选型逻辑。EKS、GKE、AKS三家定价模型差异极大,选错模型直接多花40%。这不是性能差距,是财务设计上的结构性陷阱。

控制平面:AKS的"免费"是精准狙击

控制平面:AKS的"免费"是精准狙击

EKS和GKE每小时收0.10美元/集群的控制平面费,折合每月73美元。AKS这块直接免费。

单集群时差距可以忽略。但"每环境一集群"是行业默认做法:dev、staging、QA、production,四个环境×10个团队=40个集群。EKS/GKE账单:2920美元/月。AKS:0美元。

微软把这个成本内部消化了。这不是慈善,是获客策略——用免费控制平面换你进Azure生态,再从计算、存储、出口流量把钱赚回来。

反方声音也有道理。EKS和GKE的原生网络抽象更成熟,RBAC(基于角色的访问控制)粒度更细。你确实在为运维能力付费。问题是:你的团队真的用到了这些能力吗?还是只为"可能用到"在预付学费?

计算层:折扣深度比标价更重要

计算层:折扣深度比标价更重要

m5.xlarge同等规格(4 vCPU/16GB),三家按需定价几乎一样。真正的差距在折扣机制。

打开网易新闻 查看精彩图片

AWS预留实例需要预付或按月承诺。GCP承诺使用折扣(CUDs)购买后自动生效,资源层面不锁实例类型。Azure预留虚拟机最直白,但得自己配对正确的VM系列。

GCP抢占式实例(Spot VMs)折扣最深,部分机型达91%。代价是回收最激进——CI/CD跑批任务很香,有状态 workload 崩了能调几小时。

GKE Autopilot(无服务器模式)彻底取消节点管理。你声明pod,GKE自动配节点。按pod请求的CPU/内存计费,不按节点容量。

Autopilot定价:0.0445美元/vCPU小时,0.00498美元/GB小时。平均利用率低于60%的突发负载,Autopilot能赢——你不再为"预留 headroom"买单。

出口流量:云厂商的隐形税

数据离开云厂商的价格,三家差距能到2-3倍。AWS出口0.09美元/GB起步,GCP同区间0.12美元,Azure 0.087美元但阶梯设计不同。

高流量场景下,这部分可能超过计算成本。很多团队选型时完全没算这笔账。

负载均衡器计费模式也分化明显。AWS ALB按LCU(负载均衡器容量单位)计费,规则越多越贵。GCP按转发规则数+处理流量计费。Azure最复杂,标准负载均衡器免费但出站规则单独计价。

存储和可观测性同理。EBS vs Persistent Disk vs Managed Disks的IOPS定价,CloudWatch vs Stackdriver vs Monitor的日志摄取费用——每一项都有跨云迁移时才会发现的暗礁。

打开网易新闻 查看精彩图片

三类真实团队的月账单

三类真实团队的月账单

原文给出了三个典型画像,我们直接算总账。

团队A:5人初创,2个集群,重度Spot实例用户,出口流量低。EKS约420美元/月,GKE约380美元(Autopilot节省节点管理),AKS约290美元。AKS控制平面免费+Azure Spot折扣较深,但GKE Autopilot的利用率优化更适配他们的突发负载。

团队B:50人中型公司,12个集群,混合预留/按需,中等出口。EKS约8900美元/月,GKE约8200美元,AKS约7600美元。差距主要来自控制平面费用(EKS/GKE多付876美元)和出口定价策略。

团队C:200人企业,40个集群,严格合规要求,高可用架构,大量跨区复制。EKS约34000美元/月,GKE约31000美元,AKS约29500美元。AKS控制平面免费的优势被出口流量和高级监控服务稀释,但仍是三者最低。

关键发现:没有 universally cheapest。AKS在多集群低利用率场景优势明显,GKE Autopilot对波动负载最友好,EKS的折扣灵活性在大规模预留承诺时反超。

你的集群数量和利用率曲线,决定了哪家"便宜"。

一个被反复验证的细节:团队B在迁移到GKE后,发现Stackdriver的日志查询速度比CloudWatch快3倍——但这不是选型理由,是迁移后的意外收获。他们最初只是为了那每月700美元的差价。

如果明天要新建集群,你会先算控制平面费用,还是先看哪家控制台UI更顺眼?