‍‍‍‍‍‍‍‍

点击“国家空间科学中心”关注我们吧

如果读者时间紧张且对领域了解深刻,只需痛饮第一节的“咖啡”,快速获得科技短讯和名词解析。如果读者想细细品茗或者需要更深入的了解第一节的科普知识点,不妨移动目光到第二节“咖啡伴侣”阅读。如果意犹未尽,第三节“配餐茶点”将提供更多干货和新观点。假使还不过瘾或者觉得作者个人观点需要改进,欢迎投稿公众号一起探讨。

超级浓缩干货(Espresso)

OpenAI 公司的GPT ( Generative Pre-trained Transformer) 是人工智能生成内容(AI Generated Content,AIGC)近期若干研究成果中的明星,它是通过多层变换器(Transformer)经大规模语料库训练,自动预测下一词组的概率分布进而生成对话文本的自然语言处理(Natural Language Processing,NLP)模型,目前已发展到第四代GPT-4,但从ChatGPT(GPT-3.5)开始,其出人意料的优秀表现已经成为通用人工智能(Artificial General Intelligence,AGI)研究的突破性标志。回顾过去一个月GPT在各领域掀起的惊涛骇浪,其在人工智能发展的处境和当年“日心说”的情况有所类似,故本文将在意义、应用和宣传三个维度对比两者,启发思考。

咖啡伴侣(Coffee-Mate)

1. 日心说回顾

马克思曾说:“黑格尔在某个地方说过,一切伟大的世界历史事变和人物,可以说都出现两次,他忘记补充一点:第一次是作为悲剧出现,第二次是作为笑剧出现。”[1]作为最古老的科学,天文学的发展历程与科学范式[2]发展高度契合(1),也提供了丰富的科学案例启发后世,比如“日心说”。“日心说”(2)是与“地心说”(3)相对应的一种天文学理论,认为太阳是宇宙中心,地球及其他行星围绕太阳公转(依当时时代发展局限,建议读者将这里的宇宙尺度按照范围不超过太阳系空间的规模理解)。哥白尼提出的“日心说”1.0版本认为地球和其他行星的运行轨道为正圆,导致最初理论预言和观测之间的误差明显大于迭代了许多代的“地心说”N.0版本,到伽利略时代“地心说”N.0版本已经是增加了许多本轮、均轮的复杂但精度较高的天文模型。虽然“日心说”1.0版本精度不高,但它正确的将月球修正为地球的卫星,并且整体理论更为简洁,因此吸引了当世一些天文学家和数学家的关注。其中,最关键的版本迭代由德国天文学家约翰内斯·开普勒(Johannes Kepler)提出,他将行星的圆轨道修正为椭圆轨道并提出“开普勒三定律”,可以称为“日心说”2.0版本。

(1)了解更多科学范式参见一文https://mp.weixin.qq.com/s/m8SuGQI0cfIJVDx82zGUdg.

(2)波兰天文学家尼古拉·哥白尼(Nicolaus Copernicus)提出的天文学模型, 全称“日心地动说”。

(3)古希腊时期出现的天文学假说,经亚里士多德、托勒密等学者体系化后包含哲学、宗教和科学的宇宙观。

然后,开普勒推倒了第一张多米诺骨牌,他将“日心说”1.0版本和2.0版本一起寄给了他心中的“男神”,当时的科学界顶流,伽利略·伽利雷(Garlileo Galilei)(4),那个头顶“观测天文学之父”、“近代科学实验之父”和“现代物理学之父”等称号的人类文明之星。然而,伽利略欣然选择了“日心说”1.0版本。可能在他看来,完美的圆正是上帝意志的体现,高度匹配了他可能曾产生过的将对科学和宗教的信仰融合的念头,因此伽利略非常积极的向自己的资助人和好友们,包括后来的教皇乌尔班八世,推荐“日心说”。后面的故事,读者可能有所耳闻:1615年的罗马天主教宗教裁判所对伽利略宣传倡导的“日心说”进行审查,宣布宗教禁令,1633年审判伽利略。禁令和审判是否直接导致“文艺复兴”及随之而来的科学革命的阵地从意大利转移到尼德兰及英国地区,学界尚无定论,但“日心说”确实爆火传播开来。

(4) 小趣事:伽利雷才是意大利语中的姓,但伽利略太有名了,这个错误就一直延续至今。为清晰理解,举例如下:假设某人姓名王汪,尊称时一般说王老师、王医生、王主任,而伽利略的情况在这里就变成了王汪被大家尊称为汪老师、汪医生、汪主任。(参考链接:https://encyclopedia.thefreedictionary.com/Galileo)

2. ChatGPT回顾

4 个月前ChatGPT闯入大众视野,然而其基于的Transform模型早在2017年就由Google研究团队提出,2018年OpenAI提出GPT模型,次年推出开源的GPT-2模型,此后GPT-3模型训练参数达到千亿级。背后真正让GPT-3模型升级到爆火的ChatGPT(GPT-3.5)模型的重要模块有三个:CodeX(赋予代码能力和思维链)、webGPT(赋予强大互联网搜索能力)和InstructGPT(理解人类指令并将有害、不真实和有偏差输出最小化)。去年开启的测试阶段,ChatGPT会产生若干候选答案并提供网络链接或参考文献,直接将用户作为“争端机”选择更好答案使人工智能模型获得训练提升。

如果用一幅图讲清ChatGPT的反馈如何达到类似人的程度,笔者推荐复旦和清华研究团队期刊论文中的下图[3]。

ChatGPT 通过巧妙的策略,首先压缩“ unknown unknowns ”这类超出其能力话题,以及“ unknown knowns ”这类挑战其能力话题,而尽量在“known knowns”和“known unknowns”话题上展示能力(5)。特别是情感类话题这类对人工智能来说属于“known unknowns”范畴的强化,让人感觉ChatGPT具有人类的情感。ChatGPT丰富的情感分析和对话语料库来自开放社交平台Reddit情感版块大量具有标签的话题。此外,依靠InstructGPT模块,ChatGPT的反馈更加符合人类语言习惯[4]。ChatGPT比GPT-3有改进,但改进还未跳出GPT-3的框架,因而业内称ChatGPT为GPT-3.5模型。

(5) 关于Known knowns等讨论和案例欢迎阅读 一文中的“配套甜点”。

如果说ChatGPT展示了GPT模型在内容生成方向(AIGC)的强大,GPT-4则展示了GPT模型在通用人工智能方向(AGI)的强大。GPT-4不仅支持多模态,既可以输入输出文字又可以输入输出图像,且据OpenAI团队披露[5]和第三方研究[6],GPT-4无限制版本已经可以自主调用互联网资源完成任务,比如调用在线科学计算网站计算包含特殊算符的方程式,甚至训练其他AI模型生成图像。GPT-4如果完全实现了OpenAI技术报告中的各类演示,确实可以认为点燃了通用人工智能的星火。不过目前OpenAI官网开放的GPT-4并不包括技术报告中的全部功能且处理信息数目也逐步减少到每3小时25条信息,应用GPT-4的New Bing也在短暂开放后开始针对地区进行了相关功能的封锁。GPT-3.5更像“伪装”的高级客服,模仿人类表达方式,而GPT-4开始思考、使用工具。两者如同“日心说”1.0版和2.0版,开普勒定律继续推导下去可以导出万有引力定律。

3. GPT与“日心说”的相似处

伽利略所接受的“日心说”并非最准确的模型,但是无可否认的是“日心说”确实是划时代的思想和发现。同样, ChatGPT 和 GPT-4 在特定任务上未必打败所有其他人工智能模型,但是它们的出现也是划时代的。从数学理论上说,“日心说”和“地心说”是坐标系选择的差异,但从方法论、认知论和科学范式上看,“日心说”凭借简洁实用易于理解的优势打败了“地心说”。同样, GPT 模型在单一邻域,比如英 - 德语言翻译任务中未必超越 DeepL 的人工智能模型,但它已经展现人工智能大模型巨大的应用和开发的商业价值。 GPT 带来的新一轮 AI 应用热潮已初步显现,过去的半个月,多模态的 GPT-4 横空出世,也带来一波 AGI 热潮:百度发布文心一言, Mircosoft New Bing 接入 GPT-4 , NVIDIA 发布新 GPU H100 , Adobe 发布 Firefly AI 模型 ,GitHub 发布 Copilot X 辅助编程, OpenAI 发布 ChatGPT 插件,中科院学术专业版 ChatGPT 开源。

GPT 与“日心说”也都是强大的工具,为了展示ChatGPT强大的能力,本文中有一句话完全由ChatGPT生成(未超40字)。如果聪明的读者难以找出,则说明ChatGPT即使在中文语料库不完备,训练不足情况下依然通过了初级“图灵测试”。(冷知识:ELIZA,1966年由MIT计算机科学家开发,被认为是最早通过图灵测试的机器。论文的链接: https://doi.org/10.1145/365153.365168 )

本文也分别展示了应用Transform模型和GPT-4多模态模型生成的图像(图3和图4)。

图3. 光学望远镜的发明使天文学知识的累积和更新迅速加快。此图为ChatGPT发布前通过AIGC技术生成(原图首发于)

ChatGPT 从测试阶段就对部分国家和地区进行了限制,不管是出于避免麻烦还是营销手段,反而激发了更大关注,在避开中国市场情况下2个月用户数突破1亿。类似“日心说”,越封禁名气越大,出圈速度越快。禁令下达后,伽利略众多著作中得到了爱因斯坦高度赞扬并被认为是最好的作品只得在尼德兰地区(今荷兰、比利时地区)出版以避免审查。不过,哪怕以残酷宗教裁判所闻名的西班牙,“日心说”也继续半公开的传播,毕竟“日心说”带来的天文思想革新最直接的应用就是远洋航海的导航。无论如何禁止,简单且有用的工具总会传播开来。大航海时代,宣称继承了“曾把地中海变为内湖的罗马帝国”的意大利地区诸国反而落后于“海上马车夫”荷兰、“征服者国度”西班牙和把与天主教处处作对的新教定为国教的“日不落帝国”英国。一些科普故事将伽利略去世和牛顿诞生错记为同一天,虽然不对,但也迎合了公众对科学革命话语权、海洋权柄从意大利转移到英伦三岛的感受(图4通过AIGC技术生成了牛顿和伽利略跨越时间的握手场景)。

配套甜点(Scone)

1. 习主席说:“在危机中育新机、于变局中开新局”。面对ChatGPT引发的AIGC浪潮和GPT-4带来的AGI变局,中国科研人员可以打破学科壁垒,积极参与,力争上游。比如天文科普一直在提供高质量前沿科学的输出,潜移默化的传播科学思想,非常适合AIGC累积训练所需中文语料库。笔者参与的国家自然基金交叉学部科学传播专项在探索建设新型的 AI for Science平台 (www.astro-ai4sci.com)过程中较早关注AIGC和ChatGPT技术的科普应用,并进行了一些尝试,如图3。

2. 与普通科普讲述“日心说”的故事不同,笔者认为“日心说”被教会封禁原因不在于模型认为太阳是宇宙中心。天主教会真正反对的是“日心地动说”的“地动”部分,根据《圣经》诗篇104:5(旧约中的一段经文:“他将地立在根基上,使地永不动摇。”),一些宗教人士认为《圣经》支持地球不动说。教会对“日心说”的模糊态度可以从如下事实猜测:“日心说”在当时并非鹤立鸡群的天文模型,到了伽利略时代,已经流传了近70年。随着天文观测规模和精度的提升,即使教会资助的天文学家也已发现了“地心说”的种种不足,修补、改进“地心说”的工作也层出不穷,如 Tychonic, Capellan and Extended Capellan 等模型,更多细节可以参见中国科学技术大学石云里教授的《第谷对日心说和地心说的调和》(参考链接:https://mp.weixin.qq.com/s/TqOKh1PELpKPMYZJAVKddA)。甚至有研究认为天主教会秘密修建了专门进行天文观测的修道院以评判两种模型假说的优劣。而伽利略欣然前往教廷申述也是认为说服教会采信“日心说”的时机已到,后世流传伽利略签署放弃哥白尼“日心地动说”文件时仍坚持说“E pur si muove(它(指大地)还是在动的)”。

3. GPT 是信息时代的“日心说”,但应该不会重现“日心说”的悲剧。AI也不可能替代所有人的工作,如同照相术出现后,绘画并没有从日常生活中消失,AI是人类发明的众多工具中的一种。对GPT及其他AGI大模型进行必要的监管是有益的。大家担心核聚变,却不会停下追求可控核聚变带来的清洁、“无限”能源。享受AGI大模型带来的效率提升,在必要的监管下也无需过分担心AGI或AIGC技术的滥用。

特别致谢:

国家天文台FAST首席科学家李菂老师赞助了互动猜题奖品,评论区答对的前10位朋友将获得小礼品一份!

竞猜问题是:本文中有一句话完全由ChatGPT生成(未超40字),聪明的读者能找出吗?

参考文献

[1] 《马克思恩格斯选集》第1卷第584页.
https://deyu.usst.edu.cn/_upload/article/files/7c/38/4a9ec8454ddba119441d170cdd67/b0525b88-d1bc-43fb-9b54-92f0ee537305.pdf.

[2] Tansley S, Tolle K M. The fourth paradigm: data-intensive scientific discovery [M] // Redmond, WA: Microsoft research. 2009.

[3] Zhou, J., Ke, P., Qiu, X. et al. ChatGPT: potential, prospects, and limitations. Front Inform Technol Electron Eng (2023).
https://doi.org/10.1631/FITEE.2300089

[4] Long Ouyang, Jeff Wu, Xu Jiang et al. Training language models to follow instructions with human feedback.
https://doi.org/10.48550/arXiv.2203.02155

[5] OpenAI. GPT-4 Technical Report.
https://arxiv.org/abs/2303.08774

[6] Sébastien Bubeck, Varun Chandrasekaran, Ronen Eldan, et al. Sparks of Artificial General Intelligence: Early experiments with GPT-4.
https://doi.org/10.48550/arXiv.2303.12712

作者简介

王珅,博士毕业于中国科学院国家天文台,目前为复旦大学计算机科学技术学院博士后,从事AI for science方向的天文和计算机领域交叉研究,联系邮箱:wangshen@fudan.edu.cn(转载请联系作者授权)。曾参与“中国天眼”(FAST)早期观测、早期数据中心的建设和早期科学探索项目。作为项目PI主持过9项天文观测项目,先后使用过国内外6台大型射电望远镜(FAST、Delingha、Parkes、Arecibo、JCMT和GBT)进行过包括分子谱线、脉冲星、快速射电暴等十余项天文项目的观测。

来源:中国科学院国家天文台

欢迎关注我们,转载授权、投稿事宜请
在文后留言,小编会尽快处理