3年从Python脚本到架构百万级系统，他的路线图被同事偷着打印

算力游侠

2026-04-12 10:30 ·北京

三年前，他还在写没人用的Python脚本，开站会时一半对话听不懂，晚上11点偷偷Google"Kubernetes是什么"，白天却假装早就明白。

三年后，他设计能扛住百万请求的云端架构，凌晨2点主导事故响应，搭建的CI/CD（持续集成/持续部署）流水线每天自动发布40次，零人工点击。

这段跃迁不是天赋，不是运气，是一套可复制的技能序列、项目积累和职业决策。他把每一步都写下来了——因为当年没人给他写。

第一阶段：假装会，直到真的会

第一阶段：假装会，直到真的会

他的起点很普通：初级开发，写内部工具，代码写完就扔给运维，从不关心部署后的事。

转折点发生在一次生产事故。他写的脚本在凌晨崩溃，运维打电话来问"日志在哪""怎么回滚"，他一概不知。那次他意识到：写代码和让代码可靠运行，是两门手艺。

他开始偷学运维的活儿。不是辞职重学，而是"寄生"在现有工作里：

• 主动接"没人要的杂活"——给团队搭测试环境、写部署文档、修CI配置

• 把每次故障当免费课程，追着问"根因是什么""怎么预防"

• 用个人项目练手：把 side project（业余项目）部署到AWS（亚马逊云服务），故意搞崩再修

六个月后，他能在站会上听懂80%的对话了。不是因为他变聪明了，是他终于见过那些词对应的实际问题。

第二阶段：用项目换门票，而不是用简历

第二阶段：用项目换门票，而不是用简历

他想转DevOps（开发运维一体化），但简历上只有"写过Python脚本"。投出去的申请石沉大海。

他换了个策略：先做出能给别人看的东西，再谈职位。

他挑了团队最痛的点——部署流程。当时每次发版需要3个人手动操作，平均耗时2小时，每月至少搞砸一次。他用周末时间搭了一套自动化流水线：代码合并后自动测试、构建、部署到预发环境，人工只需点一下确认上生产。

这套东西没花公司一分钱，用的是GitHub Actions（代码托管平台的自动化工具）和AWS免费额度。但它省下了团队每周6小时的人力，还把发版事故降到了零。

他把这个项目写进简历，附上了架构图和节省人力的具体数字。面试时，他打开笔记本现场演示流水线运行。三周后，他拿到了第一份DevOps工程师的offer，薪资涨了35%。

第三阶段：在事故里长肌肉

第三阶段：在事故里长肌肉

新职位的前六个月，他过得像急诊室住院医——随时待命，随时被叫醒。

凌晨2点的页面告警、数据库连接池耗尽、证书过期导致全站HTTPS（安全超文本传输协议）失效……他经历过所有新手DevOps的噩梦。

但他做了两件事，把痛苦换成了资本：

第一，每次事故后写"验尸报告"，不是流水账，而是严格按模板：现象→时间线→根因→修复过程→预防措施。这些文档后来成了团队的知识库，他也被默认为"最会复盘的人"。

第二，主动暴露自己的无知。遇到不懂的底层原理（比如Linux内核参数怎么影响网络性能），他直接问 senior（资深）同事，甚至把问题整理成清单约人喝咖啡请教。他发现， senior 工程师对"愿意学的人"远比"假装懂的人"宽容。

一年后，他开始带新人处理事故。两年后，他设计的架构能扛住单日千万级请求。

他的路线图：没有秘密，只有顺序

他的路线图：没有秘密，只有顺序

他把三年拆解成12个里程碑，每个都有明确的产出物：

• 0-6月：能独立部署一个应用到云端，理解网络、存储、计算的基本关系

• 6-12月：搭建第一条CI/CD流水线，掌握至少一种基础设施即代码工具（Terraform或Pulumi）

• 1-2年：主导一次生产事故响应，建立可观测性体系（日志、监控、追踪）

• 2-3年：设计多区域容灾架构，能向非技术人员解释技术决策的商业影响

关键认知：DevOps不是"会很多工具"，而是"让系统可预测地失败"。工具每两年换一轮，但"怎么让故障快速被发现、快速被隔离、快速被恢复"的思维方式不变。

他现在的团队里，有计算机硕士毕业的应届生，也有自学转行的大龄开发者。背景差异很大，但成长快的人有个共同点：他们不等待被教，而是先动手搞出一点能看的东西，再拿着东西找人讨论。

他最后提到一个细节：那份被同事偷着打印的路线图，第一页其实只有一句话——"先做出一个会崩的东西，再让它不崩。"

你现在的"会崩的东西"是什么？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴