打开网易新闻 查看精彩图片

图数据库界有个经典矛盾:你想像侦探一样自由穿梭查案,还是像高铁一样准点到站?Netflix 选了后者——而且是在 650 TB 的数据量上跑出了高铁速度。

打开网易新闻 查看精彩图片

这家流媒体巨头最近公开了其内部图抽象系统。不是另起炉灶搞个新数据库,而是像给现有基础设施加装了一层"智能导航":最新数据存在键值存储里,历史变更走时序抽象,Schema 直接加载进内存做校验和路径优化。整套系统架在 Netflix 自家的 EVCache 缓存层上,配合写旁路、读旁路的分层缓存策略,把重复读写压到最低。

打开网易新闻 查看精彩图片

为了快,他们主动放弃了部分灵活性。查询必须指定起点,遍历深度受限,换来的是单跳个位数毫秒、双跳 P90 低于 50 毫秒的确定性延迟。这种"带着镣铐跳舞"的设计,恰恰切中了运维监控、故障排查这类场景的刚需——工程师不需要花哨的图遍历,需要的是"点一下,结果立刻出来"。

目前这套系统托着三块核心业务:服务拓扑图(看系统怎么互相调用)、游戏社交图(看用户之间什么关系),以及带时间轴的历史状态回溯。全球部署靠异步复制保障最终一致性,缓存和存储双副本跨地域同步。

Netflix 工程师在博客评论区提到,最早推动这套系统落地的是一次游戏社交功能的故障复盘——当时他们发现,传统方案在亿级用户关系查询时 latency 飘得像股市,而业务要的是国债收益般的稳定。