打开网易新闻 查看精彩图片

2024年,一位记者用3行Python代码,从公开数据里挖出了飞往爱泼斯坦私人岛屿的私人飞机记录。这件事没靠黑客技术,没买内部消息,纯粹是"把别人懒得拼的拼图拼在了一起"。

Dhruv Mehrotra,彭博社的技术记者,正在重新定义调查新闻的边界。

他的工具不是暗访摄像机,是代码。他的线人不是匿名消息源,是暴露在公网上的数据碎片。从WIRED到彭博,这位33岁的记者证明了:技术能力本身就是新闻敏感度的一种。

从"会写代码的记者"到"记者型程序员"

从"会写代码的记者"到"记者型程序员"

Mehrotra的入行路径带着点阴差阳错。他在纽约大学学的是"新闻学与计算机科学"双学位——一个当时被质疑"两边都不精"的选择。2016年毕业后,他先去了美国公民自由联盟(ACLU)做技术研究员,帮律师们用数据挖掘政府监控项目。

那段经历让他意识到一个断层:懂技术的人不写故事,写故事的人不懂技术。2018年他加入WIRED,开始把这个缺口补上。

他的早期作品包括追踪ICE(美国移民与海关执法局)的直升机监控网络、分析警察部门购买的社交媒体监控工具。这些选题的共同点是:数据就躺在那里,但传统调查记者不知道怎么提取。

「我大概60%的时间在写代码,40%在写稿,」Mehrotra在播客里提到,「最费时间的永远是搞清楚'这个故事值不值得讲',而不是技术实现。」

爱泼斯坦岛:一次"数据考古"的完整复盘

爱泼斯坦岛:一次"数据考古"的完整复盘

2019年爱泼斯坦在狱中死亡后,关于他社交网络的猜测铺天盖地。但Mehrotra盯上了一个具体目标:谁真正踏上了那座私人岛屿?

他的突破口是ADS-B(广播式自动相关监视)。这是现代民航飞机标配的系统,飞机持续向地面和卫星广播自身位置、高度、速度——本意是提升空管安全,副作用是让全球航班变成公开数据。

FlightAware、Flightradar24这些追踪网站,本质上是在收集这些广播信号。Mehrotra做的第一件事,是向这些平台申请历史数据接口权限。

打开网易新闻 查看精彩图片

关键发现:爱泼斯坦的私人飞机有固定呼号。通过筛选2010-2019年间该呼号的所有降落记录,他锁定了一个GPS坐标——美属维尔京群岛的圣托马斯岛附近,与爱泼斯坦的"小圣詹姆斯岛"(Little St. James)位置吻合。

但飞机降落不等于人上岛。他交叉比对了两个数据源:一是岛屿访客在社交媒体上发布的照片(时间戳+地理标签),二是当地船运公司的公开航班记录——圣托马斯岛到爱泼斯坦岛只有水路通行。

「最讽刺的是,有些访客自己在Instagram上发了定位,」Mehrotra说,「我只是把不同平台上的公开信息连了起来。」

最终报道列出了数十次可疑行程,涉及政商名流。没有匿名信源,没有法律风险,全部是公开数据的重组。

计算新闻学的进化:从"会用Excel"到"会写爬虫"

计算新闻学的进化:从"会用Excel"到"会写爬虫"

Mehrotra把这套方法称为"计算新闻学"(Computational Journalism)。这个词2000年代就出现了,但内涵一直在变。

早期阶段,它意味着记者会用Excel做透视表、会画数据图表。2010年代,Python和R语言进入新闻编辑室,出现了一批"数据记者"——但他们大多停留在分析给定数据集,很少主动抓取。

Mehrotra这一代的不同在于:他们把新闻编辑室变成了小型技术实验室。

他开源过多个工具:一个用于批量下载政府网站的归档版本,一个用于识别社交媒体上的地理位置标签,还有一个用于分析PDF文档中的隐藏元数据。这些工具本身不是新闻,但降低了调查的技术门槛。

「以前你要雇一个程序员合作,现在记者自己就能跑通,」他说,「这不是取代传统技能,是扩展工具箱。」

但这种能力也带来伦理争议。2023年,他用类似方法追踪了美国最高法院大法官的私人飞机行程,引发关于"公众人物隐私边界"的讨论。批评者认为,公开数据的大规模聚合本身构成侵犯;支持者则指出,这些信息传统上就是通过航班日志、土地记录等渠道公开的,只是以前没人有能力系统性地整合。

AI在新闻编辑室:Mehrotra的实用主义

AI在新闻编辑室:Mehrotra的实用主义

打开网易新闻 查看精彩图片

作为技术记者,Mehrotra对AI的态度比同行更务实——也更警惕。

他在日常工作中使用大语言模型,但场景很具体:用AI快速理解陌生领域的术语(比如医学或金融的专用表述),或者生成代码的初始框架。但他有一条铁律:AI输出必须经过人工验证,且不能用于直接引用。

「我见过太多记者把ChatGPT的回复当成事实写进稿子里,」他说,「这在技术领域尤其危险,因为AI会自信地编造API文档或数据格式。」

他更感兴趣的是AI在数据处理层面的应用。比如,用视觉模型批量分析卫星图像的变化,或者用语音转写工具处理大量采访录音。这些场景里,AI是效率工具,不是内容生产者。

「真正的风险不是AI取代记者,」Mehrotra认为,「是新闻机构用AI降低成本,导致调查深度下降。如果你让AI写稿,你就不会派记者去现场,也就不会发现那些'计划外'的事实。」

技术民主化的悖论

技术民主化的悖论

Mehrotra的工作揭示了一个矛盾:技术让调查变得更民主,也让权力变得更隐蔽。

一方面,开源工具和公开数据降低了监督门槛。一个独立记者用笔记本电脑就能完成十年前需要团队支持的调查。另一方面,政府和企业也在升级反制手段——加密通信、数据脱敏、法律威胁。

2024年,美国多个州通过立法,限制公开访问某些政府记录;同时,ADS-B数据也开始出现加密趋势,部分私人飞机选择关闭公开广播。

「这是一场军备竞赛,」Mehrotra说,「但历史表明,信息倾向于泄露。问题只是谁来收集它,以及用来做什么。」

他的下一个项目涉及加密货币追踪——另一个技术门槛高、但数据完全公开透明的领域。方法没变:找到数据接口,写代码清洗,交叉验证,然后判断故事价值。

当播客主持人问他,给想进入这个领域的年轻记者什么建议时,他的回答很直接:「去学一门编程语言,但不要为了技术而技术。永远先问:我想知道什么?然后找工具去回答。」

如果公开航班数据明天就被全面加密,调查记者的下一条线索会从哪里来?