每次GitHub发生宕机,我们的团队就会收到告警页面。这不是偶然——Vercel的事件响应系统里,异常检测会自动提交事故报告。

最近一次事件中,我们的系统在GitHub官方状态页变更之前16分钟,就已经探测到了这次宕机

打开网易新闻 查看精彩图片

这16分钟的提前量引发了团队内部的讨论:监控的极限在哪里?是依赖平台公告,还是自己掌握检测节奏?

打开网易新闻 查看精彩图片

对开发者而言,第三方服务的不确定性始终存在。把预警能力前置,或许比等待一份状态更新更可靠。

打开网易新闻 查看精彩图片