你可能以为,关于宇宙怎么运转这件事,科学家早就摸透了。毕竟我们有个叫"标准宇宙学模型"的东西,从宇宙加速膨胀到星系怎么形成,它都能解释得头头是道。但真相是,再漂亮的理论也需要有人去验证——而且是用不依赖这套理论本身的方式去验证。最近一群研究者干了一件挺有意思的事:他们给AI换了一双新眼睛,结果发现,我们以前看宇宙的方式,可能一直有点"近视"。

这件事的核心是一种叫"遗传算法"的技术。听名字就知道,它借鉴了自然选择的思路:让一堆候选方案互相竞争,优胜劣汰,最后留下最适应数据的那个。在宇宙学里,这种算法特别有用,因为它能直接从观测数据里重建宇宙的各种性质,而不需要先入为主地假设"宇宙必须符合某个模型"。你可以把它想象成一群不知疲倦的探险家,在数据组成的高山里到处摸索,寻找最高峰。

打开网易新闻 查看精彩图片

但探险家也会迷路。遗传算法有个老毛病:它擅长看清"整体画面",却对"变化的速度"特别迟钝。这里的"变化速度"不是指宇宙在动,而是数学上的导数——描述某个量变化快慢的关键指标。打个比方,传统遗传算法能告诉你这座山有多高,但你要问"坡度在这里陡不陡",它就有点抓瞎了。

问题出在哪?在于"最优解"的陷阱。遗传算法会找到一个完美拟合观测数据的函数,但这个函数在处理那些没法直接观测的导数时,往往表现得相当脆弱。研究者打了个比方:这就像在浓雾里走路,算法可能被困在一片看起来很像终点的区域,实际上离真正的答案还差得远。数据拟合得再好,也保不齐是个"假终点"。

今年二月,一篇发表在预印本平台arXiv上的论文提出了一个新思路。研究者没有试图改进单个算法,而是换了个玩法:既然一个侦探可能看走眼,那就派一整支小队去。

这个新方法叫GAME,全称是"带边缘化集合的遗传算法"(Genetic Algorithms with Marginalised Ensembles)。它的核心操作有两步:首先,同时运行多个遗传算法,让它们各自从不同的角度去解同一个问题;然后,用一种叫"集合平均"的技术,把它们的答案加权综合起来。每个算法的投票权取决于两个因素:它拟合数据拟合得有多好,以及它给出的函数有多光滑——后者是为了惩罚那些虽然拟合度高、但弯弯曲曲充满噪声的投机取巧方案。

结果相当可观。在重建测试函数时,GAME的整体准确度比传统方法提升了20%。但真正让人坐直的是另一项指标:对于那些传统算法最头疼的导数,GAME的准确度飙升了95%。从"模糊 binoculars"(双筒望远镜)换成高清镜头的比喻,在这里不算夸张。

这个数字意味着什么?意味着我们终于有了一种工具,可以更可靠地从观测数据中提取宇宙的变化率,而不必过度依赖理论假设。在宇宙学里,很多最关键的问题都涉及变化:暗能量让宇宙膨胀加速,这个"加速"本身就是个导数问题;星系形成过程中,物质密度怎么随时间演化,也需要精确的变化率信息。以前我们苦于工具不够精细,现在至少在某些场景下,这个瓶颈被显著松动了。

不过,这里需要划几条边界。首先,95%的改进是在特定测试函数上测得的,不是放之四海而皆准的保证。其次,GAME目前解决的是"从数据重建函数及其导数"这个数学问题,它本身并不直接回答"暗能量是什么"或"宇宙会不会终结"这类物理问题——它只是让回答这些问题的工具变得更锋利。最后,这篇论文发表在arXiv上,意味着它尚未经过同行评审的完整检验,这是预印本平台的常规属性,读的时候心里要有数。

这件事的有趣之处,或许不在于GAME本身有多厉害,而在于它揭示了一个更普遍的困境:我们总以为数据越多、算力越强,答案就越清晰。但宇宙学是个特殊领域,我们能直接观测的东西极其有限,大部分信息都藏在那些无法直接测量的量里。传统遗传算法的问题,其实是所有数据驱动方法的通病——它们擅长解释"看见了什么",却不擅长推断"变化有多快"。GAME的聪明之处,是用集合智慧来对冲单个算法的偏见,这思路本身可能比具体的技术细节更值得借鉴。

当然,标准宇宙学模型目前还没有被推翻的迹象。GAME更像是一套新的检测仪器,让我们能以更高的分辨率去审视这套模型是否站得住脚。研究者自己也没说发现了什么颠覆性的矛盾,他们只是提供了一种更精密的验证手段。在科学里,这种"工具升级"往往比"惊天大发现"更踏实,也更少见。

接下来可以期待什么?一方面,GAME需要在真实的宇宙学数据上接受检验,看看那95%的改进能不能在实际场景中复现。另一方面,这种"多算法集合+加权平均"的思路,或许能迁移到其他依赖遗传算法的领域——从气候模型到金融预测,凡是需要从噪声数据中提取变化信号的地方,都可能受益。

宇宙学有个特点:它研究的是最宏大的对象,却受限于最稀缺的证据。我们永远没法像做化学实验那样重复宇宙的历史,只能在有限的观测里挖掘信息。在这种条件下,任何能把"模糊"变"清晰"的工具,都值得认真对待。GAME不是终点,但它可能标志着一个起点:我们开始承认,单个算法会犯错,而承认这一点,恰恰是减少错误的开始。