Velero把70%备份变废纸，运维凌晨3点才发现|backup|命令提示符|宿主机|废纸|快照|运维

2024年某电商平台大促，凌晨2点集群崩溃，运维按预案切到备份集群——恢复失败。排查6小时后结论：备份文件损坏，最近3个月数据全丢。这不是孤例，Gartner数据显示，未经测试的备份在真实灾难中失败率高达70%。

Kubernetes备份工具Velero（原Heptio Ark）被CNCF毕业项目光环笼罩，但"能备份"和"能恢复"是两件事。本文用MinIO自建S3后端，走完一条可验证的备份-恢复闭环。所有配置可直接复制，但那个70%的坑，你得自己跳过去才算真懂。

MinIO：把云厂商的S3账单掐死在本地

Velero需要对象存储当"仓库"，AWS S3、阿里云OSS都能接。但开发环境、涉密场景、或者单纯想省钱的团队，MinIO是更干净的选择——一个二进制文件跑起来的S3兼容存储，没有API调用费，没有 egress 流量焦虑。

Docker Compose一键启动：

```yaml version: '3.7' services: minio: image: minio/minio:latest ports: - "9000:9000" # S3 API端口 - "9001:9001" # 管理控制台 environment: MINIO_ROOT_USER: velero MINIO_ROOT_PASSWORD: Velero123StrongPass! command: server /data --console-address ":9001" ```

注意那个`mc`服务——MinIO Client在容器里等着，MinIO健康后自动创建`backup-bucket`并设公开读。很多人漏了这步，Velero后面会报`NoSuchBucket`。

启动后访问`http://<宿主机IP>:9001`，别用localhost——Velero在集群里跑，localhost指向的是Pod自己，不是宿主机。这是新手踩坑第一名。

Velero安装：Helm里的"云凭证"陷阱

Velero 1.15之后推荐用Helm部署，但官方文档有个沉默的假设：你在公有云。自建MinIO时，凭证要手动塞进Secret。

先加仓库：

```bash helm repo add vmware-tanzu https://vmware-tanzu.github.io/helm-charts helm repo update ```

关键在`velero-secret.yaml`——AWS SDK的格式，填的是MinIO的账号：

```yaml apiVersion: v1 kind: Secret metadata: name: velero-secrets namespace: velero stringData: cloud: | [default] aws_access_key_id = velero aws_secret_access_key = Velero123StrongPass! ```

Helm values里指定S3 URL时，必须用`forcePathStyle: true`——MinIO不支持虚拟主机风格的bucket域名（如`bucket.minio.local`），只认`minio.local/bucket`这种路径风格。这选项默认关闭，关了就连不上。

完整values片段：

```yaml configuration: backupStorageLocation: - name: default provider: aws bucket: backup-bucket config: region: minio s3ForcePathStyle: "true" s3Url: http://<宿主机IP>:9000 ```

部署完看Pod日志，`level=info msg="Backup storage location valid"`才算过。报错`RequestError: send request failed`？回去检查9000端口通不通，以及IP是不是写成了localhost。