三年前,他还在写没人用的Python脚本,开站会时一半对话听不懂,晚上11点偷偷Google"Kubernetes是什么",白天却假装早就明白。
三年后,他设计能扛住百万请求的云端架构,凌晨2点主导事故响应,搭建的CI/CD(持续集成/持续部署)流水线每天自动发布40次,零人工点击。
这段跃迁不是天赋,不是运气,是一套可复制的技能序列、项目积累和职业决策。他把每一步都写下来了——因为当年没人给他写。
第一阶段:假装会,直到真的会
他的起点很普通:初级开发,写内部工具,代码写完就扔给运维,从不关心部署后的事。
转折点发生在一次生产事故。他写的脚本在凌晨崩溃,运维打电话来问"日志在哪""怎么回滚",他一概不知。那次他意识到:写代码和让代码可靠运行,是两门手艺。
他开始偷学运维的活儿。不是辞职重学,而是"寄生"在现有工作里:
• 主动接"没人要的杂活"——给团队搭测试环境、写部署文档、修CI配置
• 把每次故障当免费课程,追着问"根因是什么""怎么预防"
• 用个人项目练手:把 side project(业余项目)部署到AWS(亚马逊云服务),故意搞崩再修
六个月后,他能在站会上听懂80%的对话了。不是因为他变聪明了,是他终于见过那些词对应的实际问题。
第二阶段:用项目换门票,而不是用简历
他想转DevOps(开发运维一体化),但简历上只有"写过Python脚本"。投出去的申请石沉大海。
他换了个策略:先做出能给别人看的东西,再谈职位。
他挑了团队最痛的点——部署流程。当时每次发版需要3个人手动操作,平均耗时2小时,每月至少搞砸一次。他用周末时间搭了一套自动化流水线:代码合并后自动测试、构建、部署到预发环境,人工只需点一下确认上生产。
这套东西没花公司一分钱,用的是GitHub Actions(代码托管平台的自动化工具)和AWS免费额度。但它省下了团队每周6小时的人力,还把发版事故降到了零。
他把这个项目写进简历,附上了架构图和节省人力的具体数字。面试时,他打开笔记本现场演示流水线运行。三周后,他拿到了第一份DevOps工程师的offer,薪资涨了35%。
第三阶段:在事故里长肌肉
新职位的前六个月,他过得像急诊室住院医——随时待命,随时被叫醒。
凌晨2点的页面告警、数据库连接池耗尽、证书过期导致全站HTTPS(安全超文本传输协议)失效……他经历过所有新手DevOps的噩梦。
但他做了两件事,把痛苦换成了资本:
第一,每次事故后写"验尸报告",不是流水账,而是严格按模板:现象→时间线→根因→修复过程→预防措施。这些文档后来成了团队的知识库,他也被默认为"最会复盘的人"。
第二,主动暴露自己的无知。遇到不懂的底层原理(比如Linux内核参数怎么影响网络性能),他直接问 senior(资深)同事,甚至把问题整理成清单约人喝咖啡请教。他发现, senior 工程师对"愿意学的人"远比"假装懂的人"宽容。
一年后,他开始带新人处理事故。两年后,他设计的架构能扛住单日千万级请求。
他的路线图:没有秘密,只有顺序
他把三年拆解成12个里程碑,每个都有明确的产出物:
• 0-6月:能独立部署一个应用到云端,理解网络、存储、计算的基本关系
• 6-12月:搭建第一条CI/CD流水线,掌握至少一种基础设施即代码工具(Terraform或Pulumi)
• 1-2年:主导一次生产事故响应,建立可观测性体系(日志、监控、追踪)
• 2-3年:设计多区域容灾架构,能向非技术人员解释技术决策的商业影响
关键认知:DevOps不是"会很多工具",而是"让系统可预测地失败"。工具每两年换一轮,但"怎么让故障快速被发现、快速被隔离、快速被恢复"的思维方式不变。
他现在的团队里,有计算机硕士毕业的应届生,也有自学转行的大龄开发者。背景差异很大,但成长快的人有个共同点:他们不等待被教,而是先动手搞出一点能看的东西,再拿着东西找人讨论。
他最后提到一个细节:那份被同事偷着打印的路线图,第一页其实只有一句话——"先做出一个会崩的东西,再让它不崩。"
你现在的"会崩的东西"是什么?
热门跟贴