当我们向ChatGPT问了些关于天文的问题|中子星|太阳|恒星|行星|银河系|黑洞

周一 · 知古通今|周二 · 牧夫专栏

周三 · 视频天象|周四 · 观测指南

周五 · 深空探测|周六 · 茶余星话|周日 · 太空探索

编译：王茸

校对：杨宜修韩佳安

审阅：牧夫校对组

美编：毫秒

后台：新年快乐！‍‍‍

原文链接：https://astronomy.com/news/2022/12/we-asked-chatgpt-your-questions-about-astronomy-it-didnt-go-so-well

由深度学习图像生成模型DALL-E 2根据提示生成的图像。"人工智能语言模型试图回答有关天文学问题的一幅油画。"

Image Credit: DALL·E 2/OpenAI

实验性的聊天机器人ChatGPT正成为新晋网红。

这个聊天机器人由硅谷研究机构OpenAI利用人工智能技术开发，并在一个庞大的书面文本数据库中进行训练，上个月作为免费的研究预览向公众发布，并迅速在互联网上掀起热议。用户可以要求它回答问题，生成教案，甚至创作诗歌和喜剧小品。无论你向它抛出什么提示，ChatGPT都有一种不可思议的能力，可以用简单、正确的句子生成流畅的答案，显得它信息丰富、知识渊博。

自然而然，这些能力导致一些人猜测这项技术将如何颠覆科学教育。

"嗯......我刚刚与ChatGPT就现代物理学的历史进行了20分钟的对话，"技术创始人、自称是前物理学家的Peter Wang在推特上说。"要是我在高中和大学期间有这个作为导师就好了……我的天哪，我认为我们基本上可以大规模地重新发明教育的概念，我们所知的大学将不复存在。"

因此，我们想知道ChatGPT回答天文学问题的表现如何，那么找出答案的最好方法，是向机器人询问我们的读者在《天文学》的 "问天 "栏目中提出的一些问题。

直截了当地说，这并不顺利。根据我们向ChatGPT提出的最近几期大约十几个问题（诚然，这只是一个小样本），我们可以明确建议不要依赖它作为天文学导师。

对ChatGPT来说，它对许多基本问题的处理令人印象深刻。问它一些诸如 "什么是天文单位？"或 "恒星的生命周期是什么？"——这些问题你可能很容易在教科书或维基百科的文章中找到。它可以产生完全合理的回答。

然而，一旦你开始问一些答案不那么明显的问题，并挖掘出天体物理学的微妙之处，ChatGPT就很容易给出看似合理、实则错误至极的答案。更糟糕的是，ChatGPT也很难知道自己什么时候在编造事情，而且它不能引用任何来源。

这并不令人惊讶。ChatGPT既不进行任何计算，也不查询任何事实或统计数据的数据库。它是一个语言模型，根据它从训练数据集中学到的模式，逐字逐句地生成回应。虽然它学习生成反应的强化学习（RL）过程赋予了它生成听起来自然的散文的能力，但正如OpenAI所写的，"在RL训练期间，目前没有真理的来源。" 因此，ChatGPT在处理大量文本中很容易找到的答案（或类似的答案）时表现良好，但在解释复杂的天体物理学时却很吃力，这是有道理的。

试错

以下是一个将ChatGPT引入歧途的问题的例子。

问：平均而言，银河系中每年有多少颗恒星形成？

ChatGPT：很难说清楚每年有多少颗恒星在银河中形成，因为恒星形成的速度会随着时间而变化。然而一般认为，银河平均每年产生一颗新恒星。这可能看起来是一个小数字，但是请记住，银河系是个拥有数十亿颗恒星的庞大星系，所以即便每年增加的新恒星数量很少，也很快会增加。

这个答案围绕着一个事实的内核，但却犯了一个关键的错误——混淆了恒星的数量和构成恒星之物质的数量。正如苏格兰爱丁堡大学的天体物理学家安妮特·弗格森（Annette Ferguson）在我们2022年11月的期刊中写道，天文学家估计，我们的银河系中每年大约有1到2个太阳质量的恒星形成。但是，她解释说："当然，并非所有这些质量都进入了一颗恒星。大多数形成的恒星是低质量的恒星，其质量小于太阳——我们银河系中最常见的恒星是红矮星。因此，平均而言，我们预计每年大约有6到7颗新的恒星在银河系形成。"

ChatGPT也在为黑洞研究错综复杂的问题而挣扎。这个答案一开始还不错（尽管是同义词），但当它试图总结目前技术状况时，就走下坡路了。

问：如果两个超大质量的黑洞合并，会发生什么？

CharGPT：当两个超大质量的黑洞合并时，其结果是产生一个更大的单一黑洞。黑洞合并的过程被称为 "黑洞合并"。

在合并过程中，黑洞将以引力波的形式释放巨大的能量。这些波是时空结构中的涟漪，由大质量物体的加速产生。两个超大质量黑洞的合并所产生的波，可用高度敏感的仪器——引力波探测器来检测。

两个超大质量黑洞的合并，也可以产生称为类星体的明亮光爆。类星体是宇宙中最亮的一种物体，被认为是由物质吸积到超大质量黑洞上而产生的。

值得注意的是，两个超大质量黑洞的合并是一个罕见的事件，它可能发生在数百万或数十亿年的时间尺度上。然而，从这样的合并中探测到引力波，将是重大的科学发现，并可以为研究黑洞性质和星系演变提供启示。

与ChatGPT的自信断言相反，目前的引力波探测器无法探测到超大质量黑洞（SMBH）的合并。迄今为止，激光干涉仪引力波天文台（LIGO）等设施对黑洞合并的所有探测，都只是恒星质量的黑洞。位于星系中心的超大质量黑洞——其质量相当于数百万个太阳——产生的引力波之长度极高，以至于一个波要花几年时间才能通过地球。目前正在尝试探测这种背景波的海洋，但不是用我们称之为引力波探测器的仪器。有个叫NANOGrav的合作项目，通过测量脉冲星的时间变化，用射电望远镜收集了诱人的证据，这些脉冲星的信号在穿过银河系时，可能会受到引力波的干扰。

ChatGPT在其答案中犯了另一个错误——一时将黑洞合并与物质的增殖过程混为一谈。类星体是活跃的星系，其中心黑洞正稳定地吞噬物质，并发出强烈的无线电波，而不是伴随超大质量黑洞合并的突然闪光。(关于为什么超大质量黑洞合并会产生可探测的光，而恒星质量黑洞合并则不会，请看美国伊利诺伊大学天体物理学家Liu Xin在我刊2022年6月号的回答）。

由深度学习图像生成模型DALL-E 2根据提示生成的图像。"检测引力波的脉冲星定时阵列的示意图。"

Image Credit: DALL·E 2/OpenAI

这是另一个关于黑洞的问题，ChatGPT给出了一个完全错误的答案：

问：我读到中子星的磁场强度比宇宙中发现的任何其他磁场都大。一个超大质量的黑洞不是会有更强的磁场吗？

ChatGPT：不，中子星的磁场强度并不比黑洞的磁场强度大。事实上，人们普遍认为中子星的磁场比黑洞的磁场要弱。这是因为黑洞的磁场是由其附近极强的引力产生的，而中子星的磁场是由恒星内带电粒子的运动产生的。因为黑洞的质量比中子星大得多，它们的引力也强得多，这使它们能够产生更强的磁场。

这是错的，而且是基于一个错误的前提。正如英国利兹大学的天文学家安德烈-伊戈舍夫（Andrei Igoshev）在我们2022年8月的期刊中写道，"黑洞本身并没有任何可测量的磁场"。这是因为 "无毛定理"，该定理基本上指出，每个黑洞只有三个可观测的参数可以确定：质量、电荷和旋转。这里的头发是对所有其他可能的参数的比喻，包括磁场，它们在黑洞内消失，成为科学家无法接触到的。" 正如伊戈舍夫所解释的，在超大质量黑洞周围可以发现磁场，但它们是由事件穹界外的物质漩涡盘产生的，而不是黑洞本身。而且它们比脉冲星和磁星等旋转的中子星产生的磁场要弱得多。

ChatGPT也对下面这个问题生成了不完整而且矛盾的回答。

问：为什么巨行星的旋转速度比我们太阳系中的陆地行星快得多？

ChatGPT：我们太阳系中的巨行星，比如木星和土星，旋转速度比地球和火星等陆地行星快得多，因为它们更大、更有质量。一个物体的质量越大，它的惯性就越大，这意味着需要更多的力量才能使它改变运动方向。这就是为什么巨行星尽管体积大，却能够快速旋转。此外，巨行星也更有可能受到太阳系中其他物体的引力的影响，这可能导致它们随着时间的推移旋转得更快。

尚未解决的问题是巨行星首先是如何旋转得如此之快、巨行星的大气层和内部的区别、以及科学家们自己也不确定答案的事实。

正如苏黎世大学的行星科学家Ravi Helled在我们2022年10月的期刊中解释的那样，"我们仍然不完全了解是什么决定了巨行星的旋转速度；这是行星科学中一个关键的开放性课题。" 行星可见表面的云层可以在几个小时内变换一次，但我们不知道行星的深层内部是否与它们同步旋转。然而，Helled补充说，科学家们 "确实对是什么让外行星如此快速旋转有了一些了解。我们认为，这与它们的形成历史和相对较高的质量有关......随着气体被吸附到行星上，它增加了总角动量，这反过来导致了快速旋转。"

你的里程数可能会有所不同

ChatGPT的另一个局限性--OpenAI也完全承认--是当问题的措辞只是稍作调整时，它可以疯狂地改变答案。因此，如果你注册一个账户并尝试问它这些问题，你可能会得到一些不同的东西，甚至可能是正确的。但是，如果没有外部知识，就不可能知道ChatGPT什么时候是正确的，什么时候只是在编造。

当然，对于这项技术来说，现在还处于早期阶段。OpenAI的语言模型正在迅速改进，据说谷歌已经开发了一个更好的语言模型，但它至今仍拒绝向公众发布。然而，最近的人工智能发展史表明，虽然深度学习技术可以产生在某些任务上超过人类的人工智能机器人--比如下围棋或折叠蛋白质--但它们在其他任务上可能非常不靠谱，比如安全驾驶汽车穿梭在繁忙的城市。通过复杂概念进行推理的能力，有时会绊倒专业的天文学家，是否属于前者还是后者，还有待观察。

如果不出意外的话，这些答案清楚地表明，语言模型没有 "智慧"。把ChatGPT看作是你的智能手机键盘上的预测性打字功能的极好版本可能更好一些。该机器人的强化学习诱导它产生类似于人类想要产生的东西，这是由它所训练的令人难以置信的数据量所告知的。其结果往往是令人惊讶和有趣的，甚至是我们称之为创造性的东西。但是到目前为止，至少在天文学方面，你应该不会想依靠它来告诉你真相。

责任编辑：杨伯顺

牧夫新媒体编辑部

『天文湿刻』牧夫出品

微信公众号：astronomycn

谢谢阅读