前副总统戈尔联合创立的碳排放数据库，被指遗漏了城市里最多的那部分碳|戈尔|排放源|数据源|碳排放数据库|算法|能源

“当你手里有一份号称要指导全球气候政策的地图，而它可能画错了最热闹的街道，你该怎么办？”这是北亚利桑那大学信息学、计算与网络系统学院的凯文·格尼教授最近抛给同行的一个问题。他领导的一项新研究直指一个由美国前副总统阿尔·戈尔联合创立的全球温室气体排放数据库——Climate TRACE，认为它在估算城市车辆二氧化碳排放时，可能出现了系统性的巨大缺口。根据研究人员的说法，这个数据库平均低估了美国城市车辆二氧化碳排放量大约七成。

这项发现发表在《环境研究快报》上。格尼教授的团队并没有停留在宏观印象里，而是把两套数据摊开，一个城市接一个城市地比对。一套是被他们视为基准的“Vulcan”道路排放数据库，由格尼的实验室长年维护，其校准依据的是官方交通流量记录和能源消费数据；另一套就是Climate TRACE，一个寄托了很多人对人工智能监测环境厚望的新生代数据库。比对结果让研究人员自己也觉得意外——Climate TRACE给出的数字，整体比Vulcan低了不是一点半点。

说人话就是：当我们以为某座城市每天有成千上万吨二氧化碳从汽车排气管喷出时，Climate TRACE的画像里，这些车似乎凭空消失了一部分，或者被极大地调低了存在感。如果把这两个数据库的差异放在一起看，更像是在看两张拍摄于同一片街区、但车辆稀疏程度完全不同的街景照片。

这项研究的具体做法很直接。团队选取了美国260座城市，把两套数据库里每一座城市的道路车辆二氧化碳排放量摆在一起对比。格尼的合作者、该校博士后比拉尔·阿斯拉姆解释说，Vulcan当然也不完美，其不确定性大约在14%左右，这个误差范围虽然值得注意，但远不及他们发现的差异——Climate TRACE排放值平均比Vulcan低了七成。而在某些地方，差距更加惊人。研究参与者、研究助理帕夫洛克·达斯补充道，印第安纳波利斯和纳什维尔这样的城市，被低估的幅度甚至超过九成。这就好比一家超市的收银系统，给一半以上的商品都算错了价格，有的商品价格干脆只记了一折。

那么问题出在哪里？研究人员并没有把责任完全归咎于某个单一环节，而是指向了一个更根本的疑虑：Climate TRACE所依赖的“有前景的新型人工智能方法”，可能在某个关键步骤上漏掉了城市的呼吸节奏。人工智能擅长从卫星图像、手机信号、航运数据等海量信息中抓取人类活动的蛛丝马迹，但车辆排放这件事，往往藏在拥堵路口的怠速运转里，藏在每天两次的潮汐式通勤里，藏在物流卡车的深夜穿行里。如果算法看到的只是某条道路的“存在”，而没能充分捕捉到它上面实际流动的车龙密度，那么对排放的总账就会出现系统性的低估。

格尼的担忧并不只停留在车辆排放这一个领域。此前，他已经在另一项研究中发现Climate TRACE对发电厂的二氧化碳排放估算也存在类似问题。这让他开始把两件事联系起来看：如果一份数据库对发电厂和城市交通这两个最大的化石燃料燃烧排放源都给出了明显偏低的数字，那么对于城市气候政策的制定者而言，他们手里拿到的可能是一份信息严重不全的路线图。格尼用了一个很审慎但不失严肃的表述：“结合我们先前关于Climate TRACE发电厂二氧化碳排放的研究来看，我们的结果表明，Climate TRACE的数据显著低估了美国城市中超过一半的化石燃料二氧化碳排放。”

这份表述的分量在于，它并不是在否定人工智能的潜力。恰恰相反，格尼和他的同事们反复强调，人工智能在监测环境状况、生成排放估算方面拥有巨大的前景。它可以把那些过去需要大量人力逐层上报、反复校对的排放清单工作，变成一种近乎实时的、全球覆盖的动态捕捉。但前提是，这种捕捉必须经得起独立数据的纠偏。而Vulcan数据库正好提供了这样一种独立视角——它不从算法推演出发，而是从州级交通部门和联邦能源信息机构长年累月的行政记录和燃料消费台账中，一步步反推出车辆在每条道路上的碳排放。

两套数据的差异，其实也折射出当前排放监测领域的两条技术路径之争。一条是以Vulcan为代表的“自下而上”路径：先知道一条路上跑了多少辆车、什么车型、烧了多少油，再把这些数字换算成碳排放，每一个环节都有可追溯的行政记录作为锚点。另一条是以Climate TRACE为代表的“自上而下”路径：横跨多个卫星数据源，利用机器学习识别烟囱、车流、船舶信号等视觉特征，再反演出排放通量。后者的优势是快、覆盖面广、能延伸到许多缺资料的地区，但风险也恰恰在于，它可能会在某些城市化的密集场景里看漏了最活跃的碳排放源头。就像一个从三万英尺高空俯瞰大地的摄影师，能拍出山峦河流的壮观轮廓，却很难看清每一条街道在晚高峰时段的尾灯长龙。

研究人员还在论文中表达了更深一层的担心：这种低估可能并不局限于美国境内，而是可能影响到Climate TRACE数据库在全球范围内的表现。因为车辆排放的特征在印度、巴西、中国等国家的城市里，往往比美国更为复杂——摩托车、三轮车、老旧柴油巴士、非正规燃油供应链，这些都可能进一步放大单纯依赖算法识别所带来的偏差。如果在美国这样数据相对丰富的地区，城市车辆排放都能被低估七成到九成，那么在其他数据环境更为嘈杂、验证方法更少的地区，实际差距也许更加难以界定。当然，研究团队目前还没有发表针对全球其他地区的量化分析，这还只是一种基于现有发现的谨慎推想。

这种推想的谨慎之处在于它没有给出结论，而是给了一个方向：需要对数据库的其他方面进行额外的审查。这背后有一个容易被忽视的知识逻辑——排放清单从来不是一张可以一拍定影的照片，而是一幅需要不断叠加新图层、不断回溯校准的动态拼图。任何一家声称能一次性给出全球排放全貌的数据库，本质上都是在用一个有限的模型去逼近一个极度复杂的物理世界。而当这个模型在某个关键节点出现系统性的偏移时，它影响的不光是数据本身，还有那些基于数据设计的碳市场配额、减排责任分配以及城市交通电动化时间表。

如果你还记得几年前那种“只要用AI一扫，全球所有碳排放立刻水落石出”的乐观预期，那么这项研究就像是一次冷静的结构性复盘：AI可以帮你把视野扩展到以前看不到的角落，但如果你没有用脚丈量过的地面数据来校准，它也可能把整条街的车流压缩成背景噪音。研究人员并不否认Climate TRACE所采用的AI路径的先进性，但他们希望使用者明白，这份数据的城市车辆排放部分，在眼下这个阶段，可能要先打个不小的折扣再去解读。

一个值得停留的细节是，格尼把两项研究的发现拼在一起后得出的判断，并没有把问题局限在技术误差的范畴，而是将它与政策决策的可靠性联系在一起。排放数据一旦被写入国际气候谈判的参考文件、被用作碳减排目标的基线、或者被某个城市用来评估交通环保投资的成效，它的误差就不再只是研究论文里的百分比数字，而是会实实在在地牵动资源流向。这或许也是为什么他在措辞中始终使用“可能”“显著”“值得关注”这样的保留语气，却同时选择在公开声明中明确表达担忧——科学家给自己留的边界，恰恰是为了让不确定性成为被讨论的议题，而不是被忽略的角落。

对于普通的城市居民来说，这件事似乎远离日常，但其实它离你并不远。每一个关于“我们城市的空气质量到底好转了没有”“地铁修好后汽车排放降了多少”的回答，背后都依赖类似的排放清单。如果数据库给出的画像偏瘦，那么决策者就有可能把本就紧张的治污资源投向不那么紧迫的方向，而真正的排放热点依然在悄悄释放。这不是关于某个名人的名声问题，而是关于一把正在被校准的尺子，能不能准确量出人类减碳努力的尺寸。

目前，这项研究留下的最大悬念是：Climate TRACE团队会如何回应这些来自独立第三方比对的差异？人工智能的训练方法会不会因此做出调整？其他排放源——比如工业锅炉、船舶、飞机——是否也存在类似的系统性偏差？这些问题暂时没有出现在这次发表的论文里，但格尼和他的同事们显然已经把下一步的研究视野投向了数据库的其他部分。在科学发现的链条上，指出问题的价值往往不亚于解决问题，因为它提醒所有依靠这把尺子的设计者、决策者和投资者，在用之前，最好先晃一晃尺子，看看刻度是不是歪了。