Uber把地图切成690亿个六边形，工程师发现后集体破防

灰度测试中

2026-04-01 08:50 ·北京

每秒处理1万条GPS坐标，你的数据库CPU会先冒烟还是账单先爆炸？这是物流平台每天都在做的选择题。答案藏在两种技术的夹缝里：让用户随手画边界的PostGIS，和把地球切成六边形网格的Uber H3。

纯数学视角下，H3是艺术品。但让仓库管理员用六边形画装卸区？那是UX灾难。真实世界的配送中心、禁区、电子围栏——没一个是规则的。

用户要的是随手画，系统要的是跑得动。这个矛盾逼出了一套" hybrid 架构"：前端自由画，后端偷偷转成六边形索引。

PostGIS：精准但昂贵的"笨办法"

PostGIS：精准但昂贵的"笨办法"

最直白的方案：GPS坐标来了，直接问数据库"这个点在哪个多边形里"。Go代码写起来很清爽——ST_Contains函数封装了射线法之类的空间数学，返回命中了哪个围栏。

GiST索引能加速，但本质没变：每次查询都是一次复杂的几何运算。10k QPS下去，PostgreSQL的CPU曲线会教你做人。云账单上的数字，比仓库里的叉车还忙。

这就像是让每个快递员进门前先解一道微积分——答案是对的，但门可能早就关了。

H3：用690亿个六边形换O(1)查询

H3：用690亿个六边形换O(1)查询

Uber开源的H3把地球切成多层六边形网格。最细粒度那层，全球有690亿个格子。每个(lat, lng)被哈希成一个字符串——比如8928308280fffff。

查询变成啥？Hash Map查键。O(1)。不碰数据库，内存里直接判定点是否在区域内。

但用户不画六边形。所以后台跑异步任务：拿到用户画的任意多边形，用Polyfill算法"填满"它涉及的H3格子，存进Redis或索引表。

前端感知不到这层转换。管理员画了个歪歪扭扭的禁区，后台默默生成几百个六边形ID。GPS坐标来了，先算它属于哪个H3格子，再查Redis——0.1毫秒 vs 原来可能的50毫秒。

空间换时间，精度换速度。但这里的"精度损失"控制在六边形边长几米到几百米可调，对物流场景足够用。

Go实现里的两个关键取舍

Go实现里的两个关键取舍

代码层面，这套架构在Go里分两条 pipeline：

实时路径用H3：GPS入队 → 计算H3索引 → Redis查围栏ID → 返回业务逻辑。全程内存操作，无锁哈希表扛住并发。

管理后台用PostGIS：用户保存多边形 → 异步Polyfill生成H3集合 → 双写Redis+持久化。编辑时回显原始几何，保证"所见即所得"。

一个细节：H3的Polyfill在凹多边形边缘会有"锯齿"，这是六边形逼近任意形状的代价。物流场景通常接受——你不会因为围栏边界差了两米就误判一辆卡车。

但如果是无人机空域管理？那得保留原始PostGIS做二次校验，H3只做初筛。架构变成分层漏斗：H3过滤99%的明显无关点，PostGIS精确判定边界争议案例。

没有银弹。只有场景化的妥协。

为什么不是S2？为什么不是Geohash？

为什么不是S2？为什么不是Geohash？

Google的S2同样做球面网格，但四边形在局部逼近圆形区域时，边角效应比六边形严重。Geohash是Z-order曲线，相邻区域前缀相似——这本是优点，但跨经度180度时连续性断裂，全球物流平台得专门处理这种边界情况。

H3的六边形有12个五边形"缺陷"（正二十面体顶点处），但Uber把它们固定在海洋和人烟稀少区。对陆地物流，你几乎碰不到。

更关键的是生态：H3的Polyfill、K-ring邻居查询、层级聚合，在物流场景下有现成套路。S2更强于球面几何运算，但"画个多边形转成索引格子"这条路径，H3的社区工具链更成熟。

一位在东南亚跑冷链物流的工程师说过：「我们试过纯PostGIS，RDS实例从4核飙到32核才扛住早高峰。切到H3+Redis后，2核机器还有余量。」

省下的钱够养一个小队的后端。

现在的问题是：你的业务里，有多少查询是可以被"六边形化"的，又有多少必须保留精确几何？这个比例，决定了你的架构能省多少台机器——以及，能让多少工程师少熬几个通宵。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴