手动配监控这件事,做过的人都知道有多烦。AWS Lambda上搭个Datadog,日志、告警、仪表盘一个个点过去,第一次挺顺利,团队一扩张就开始崩——新环境漏配了、新人来了找不到文档、生产测试配置对不上,排查问题先花半小时确认监控是不是全的。

Observability as Code(可观测性即代码)就是来解决这个的。思路很简单:把监控配置当成代码一样管,塞进版本控制,跟着应用一起部署。

打开网易新闻 查看精彩图片

具体怎么做?用Serverless Framework + Datadog插件。部署时自动干这几件事:挂上Datadog Lambda Library层做APM埋点,挂上Lambda Extension层直接发数据到Datadog(不用另建Forwarder),环境变量自动注入,还能在serverless.yml里定义监控规则,一键创建或更新。

好处列出来很实在:配置版本化、环境一致性、Code Review能审监控规则、灾难恢复时监控配置跟着代码一起回来。团队大了之后,这套标准化能省不少运维成本。

作者拿一个"旅行费用估算"API演示——POST传天数、人数、住宿档次,返回费用明细。Node.js写的Lambda,配好serverless-plugin-datadog,sls deploy下去,APM追踪、日志结构化、错误率和延迟告警全齐。

成本控制和最佳实践作者也提了,但核心就一句:监控别手动点,写成代码管起来。