黄学东院士：ChatGPT虽然厉害但不可能取代人类|人工智能|卡内基梅隆大学|微软|美国|院士|黄学东

作者|章剑锋

出品|网易科技《科学大师》栏目

微软云全球人工智能首席技术官，是位华人，他叫黄学东。在ChatGPT火爆中国之后，我注意到了他。

ChatGPT是一款由OpenAI研发的生成式人工智能模型，微软是它最大的投资方。有关于它的神乎其神，市面上有着各种各样不好确证的传言和解读，而媒体也注意到，在它的研发团队成员中，有不少年轻的华人面孔，其中不少人的大学阶段或研究生教育是在中国国内完成的。

图片由受访者提供

黄学东先后在湖南大学和清华大学读本科和研究生，1987年前往英国爱丁堡大学深造，攻读博士学位，后又前往美国卡内基梅隆大学从事研究工作。1993年，他加入微软公司，一呆就是30年，成为一位全球人工智能领域顶尖的华人工程师。

微软先后走出过多位知名业界的华人高管，如李开复、张亚勤、沈向洋、张宏江、洪小文、陆奇等人，黄学东相对低调很多，早在上世纪90年代，他就推动和策划了微软公司管理层在北京组建微软中国研究院（后来的微软亚洲研究院），于幕后做了不少工作，包括具体到面试研究院的管理者，帮助微软公司引进和面试了李开复、张亚勤、张宏江等业界大牛。

今年，黄学东先后当选了美国国家工程院院士和美国艺术与科学院院士，成为计算机领域大陆改革开放后培养出的第一位美国双院院士。采访他时，我才知道，整个微软的认知服务，从创建到落地到推出，他一直是领导者和灵魂人物，他也是微软公司最接近ChatGPT项目的人之一。

关于ChatGPT与微软现有人工智能产品的关系，黄学东向我解释说，微软认知服务，包括了微软语音，微软计算机视觉、机器翻译和Azure OpenAI services，而Azure OpenAI services就包括ChatGPT、GPT4.0、DALL.E等，它们都是同样的API（Application Programming Interface，微软应用程序），而这些都是黄学东领导的团队在过去几年推出来的。

他说，“微软认知服务是微软从人工智能研究到落地以来一个经典的产品，影响了众多的客户。Azure OpenAI的ChatGPT也是微软认知服务框架下的一个产品”。

一，你只看到ChatGPT一枝独秀，却没有看到另外90%的失败

《科学大师》：ChatGPT在中国大火，各种公司和主体纷纷进入这个研发和投资赛道，我们担心会存在某种非理性的狂热，最终把泡沫吹大吹破。您怎么看这个问题？美国也有这种情况么？

黄学东：我对中国国内的情况不太了解，所以不敢随便发言。在美国，我觉得谷歌、 Meta、微软公司和OpenAI做得都差不太多，美国现有三家大的云平台在做这个事，市场上已经有的是微软和OpenAI合作推出的ChatGPT，谷歌有他们自己的东西，扎克伯格的Meta也做了一个开源的大模型，基本上就是这几家了。那Amazon （亚马逊）也正在开发他们自己的东西。还有一些初创公司，有几家也在做类似的东西，大概总共是10家左右。我觉得这样很好，有竞争才有进步。

至于你关心的最后谁能跑出来，成为王者，现在从技术层面来讲，我觉得微软和谷歌无疑是处在领跑者的位置，两家的优势都是比较明显的。

《科学大师》：为什么微软这么有眼光，它能够下重注来投资OpenAI，甚至马斯克都退出了，在这个阶段，微软却走在了前面？

黄学东：这得要感谢我们的CEO萨提亚·纳德拉，他为什么能做上CEO是有原因的。他有这个眼光，这完全是他的功劳，同时，微软一直有这种前沿探索的眼光和理念、理想，这是一种内驱力，所以才能做出这一类投资决策。

微软一直以来其实也投资了很多东西，不仅仅只是投资了这一个ChatGPT，只不过大家看到的是今天ChatGPT跑出来了，跑在前面了，看到我们在这一阶段的成功，但是还有其他90%的项目是还没有成功，大家没有看到那90%的故事。

《科学大师》：陆奇最近在国内演讲中说到，像GPT这种语言大模型，微软内部也有好几千人在做，但是最终还是不如Open AI做得好，您认同他的看法吗？

黄学东：我们跟Open AI一起合作做的这件事，它是在微软的云平台Azure上，一起做的，所以你不能说微软就没有做好，我们有这个基础，而且创新也是基于这个基础，这是第一点。

第二点，也不能说微软人工智能团队就无所作为，在智能语音、计算机视觉、机器翻译等方面，这些微软现有的认知服务，它的性价比还是业界第一的。

很多人没有看到微软的人工智能研发是一个多维的东西，在这个多维的组合中，微软现有的这个API，它是一个模型可以做一件事情，你要做语音识别，它就是一个语音识别的模型，要做机器翻译，机器翻译就有一个模型，要做文本总结，就有文本总结的模型，你要做计算机视觉，也都有一个这样的大模型，但是目前这个大语言模型，它不一样的地方是，很多事情可以通过提示来做而且做得非常好，这是之前没有的。但随之而来，是它的成本也上去了，它并不是十全十美的，就像一个豪华的汽车和一个很便宜的汽车，这两者都有它的应用价值，你不能说现在有了一个豪华汽车，就把经济实用型的汽车说成是没有什么用。

图片由受访者提供

二，ChatGPT算迈向超级人工智能的一小步，但还没达到这个目标

《科学大师》：GPT出来后，大家试用过觉得这个东西挺不成熟，是在一本正经的胡说八道，比如说，黄学东院士当选美国两院院士的时间，这个知识点它就说得不对，它给出的时间要早于您当选的确切年份，这挺让人尴尬的。

黄学东：这是我们应该关注的问题，当前生成式人工智能还不够成熟。如果一个人的鉴别力不是很好，那他就容易被人工智能忽悠了。这就跟人一样的，人虽然是地球上最高等级的智能体，但有时候也会不可靠，他大部分时间是对的，但是不靠谱的时候也会胡来，而怎么样能够让这种生成式人工智能变得越来越靠谱，这是我们人工智能发展中需要实现的事情。只有把成熟的人工智能用于教育和宣传，才是对社会有益的。

大语言模型在上世纪70年代就有了，IBM当时的语音识别研发团队就已经推出，但当时它的识读能力有限。现在这个大模型，是从机器翻译这个领域抽出来的，用的是机器翻译的一个方法确精准变换器，它没有超越机器翻译实现新的突破，但是它看了很多很多的东西，然后预测下一个词汇怎么样，就相当于把整个搜索引擎所有文本全看了一遍，用更多的数据训练它，并加上了奖励建模和强化学习与人类的预期对齐等技术，然后通过不同的提示可以突然涌现一些令人惊奇的能力。确实能做到一本正经，显得很有智能，但是它还没法做到完全精确精准，不能完全把错误剔除，它的稳定性目前还没有办法实现的。

它用的是深度学习的基础架构，最主要的一个特点就是自学习并加上奖励建模，把所有的数据全拿过来，所有的语言都拿过来，根据这个它可以自己学习，就是说看了一个文章以后你下面要讲什么东西，可以不用标注的数据，它看了前面一段文章（问题），它就能知道后面一段文章，可以翻译出来（给出答案和对策），这是GPT4.0，就是自己跟自己“翻译”。

这是一个大力出奇迹的事情，你用的训练数据达到一定地步以后，就会涌现很多看似惊人的东西。

现在的问题是，怎么改进它？使它变得更加的精确，让它给出的信息不会似是而非，对人产生误导。

我认为它需要带着知识奔跑（running with the knowledge），不是通过GPT自己来解决，而是在GPT给出结果以后，还需要再加一层防护罩，对它的结果用外部知识进行核实，这涉及到对许许多多垂直领域知识和信息的整合和鉴别能力，只有实现这一点，人们对于人工智能的使用才会更加科学和保险。

《科学大师》：可以说它还不是一个超级人工智能？

黄学东：超级智能，有一个阶段性的定义。

我举个例子，搜索就是一个最大的人工智能系统，可以说它是超级智能，为什么？因为不管你搜什么东西，它都能给你回答。没有任何人具有搜索功能那么强大的记忆力。我们就从记忆力这一点来讲，今天的搜索引擎已经超越了我们每一个人。

也许大家会说，它这不能算是人工智能。但是我必须说，记忆是智能的一部分。从记忆这个维度来看，它已经有了超级记忆的智能。它记得比我们多，算得比我们快。

现在ChatGPT又是怎么一回事呢？我认为它是原有计算机搜索技术运用的一种阶段性提升，是很大的一种提升。它把传统搜索引擎给到我们的信息，压缩成一段一段的总结、归纳，你问它什么问题，它可以完美地通过一段文章给你描述出来，不是通过传统的搜索引擎形式给你一堆不经加工的信息，而是通过对这些翻译结果的奖励排序与人们的预期对齐。你说它是不是超级智能？从记忆维度来看，它确实是。它自动生成的东西，有时候看起来还写得很“漂亮”。但是它真正有深度理解和推理能力吗？没有，它只是一种记忆压缩，然后再释放，重新展现在大家面前。

图片由受访者提供

三，GPT有自己的“脾气”，但它不可能取代人类

《科学大师》：很多人说得很夸张，认为GPT会带来失业潮，好多工种会被替代，搞得人心惶惶的，您认为这种担心有必要吗？

黄学东：每一种新的技术出现以后，总会对社会旧有的局面产生冲击，但是我们也应该注意到，新技术的出现同时也会带来更多的机会，带来更多可能性。

就像汽车出来之后，司机取代了马车夫，电脑的普及以后，打字员的岗位也就没有了，ChatGPT出来，会取代很多白领，但我认为它不会是简单的对白领实现取代，它让他们可以往上发展，使他们可以从很多重复性的琐碎的工作中脱身出来，能去做更有创造性和更有价值的事情。就像微软办公软件Office可以帮人提高生产效率，现在GPT这套东西整合进去之后，全新的Office会重新定义什么叫做生产力软件及相应的应用场景，这并不是说会让好多人都找不到饭碗。

既使没有这种技术，我认为任何时候都会存在职业可取代的情况。要问的是，什么样的人是不可取代的？就是创造型的人才，不会失败、不会过时的，永远是人的思想，人的原创性思维，你必须确保自己有独到的见解，而不是人云亦云，把人家的东西拿过来装饰一下，这种工作的价值会越来越低。当然我不能说他绝对就没有空间，社会是多样的，各种需求都存在，不可能人人都成为精英，非精英的普通人永远是大多数，这些人也应该会有自己的生存空间。我认为需要乐观看待新技术的出现。

《科学大师》：另一个让人疑惑的问题是，不少人鼓吹说这种人工智能模型，会具备独立的自我意识或者自主意识，然后会对人类实现反超，这有科学上的依据吗？

黄学东：看你怎么解释和定义这个自我意识，它作为一个语言模型，当然有它的脾气。如果说它有自主意识，那当然也没问题。我记得有纽约时报的一个记者就跟它调侃，结果这个语言模型就跟他说，唉呀我爱上你了。这个记者就说我不行，你别爱上我，我结婚了。这个模型就说，你老婆不好，我更好。这种对话，你说它是不是属于自主意识？它确实是的，就是因为看了很多这种资料，通过训练后，记住了很多东西，一不小心它就可能干这种事情。

我觉得它就是一个很大的压缩器，把过去所有看到过的信息全部压缩下来，然后存放起来，一旦被触发或引导，就有这种表现。这时候你觉得它是真的爱对话者吗？不是，它只是用文字表述出来，好像它真的爱他一样。这当然不是真实的人格型情感的表露。

四，ChatGPT的成功不是偶然，一流创新需要土壤

《科学大师》：ChatGPT面世后，大家发现，OpenAI这个研发团队中有不少华人面孔。包括您这样杰出的人工智能专家，也是从我们中国走出来的，华人杰出人才的涌现，在美国是一个特别的现象么？

答：我觉得中国人和其他国家的人在美国都做得非常好，都很出色，绝对不能说中国人有什么缺陷，大家都不会有这样的认识。

不管你是什么样的种族，什么样的教育背景，只要有能力，在美国发展的机会是很大的，它本来就是一个移民国家，这里不仅仅有华人面孔，各种各样的面孔都有。比如英伟达的CEO黄仁勋和Zoom的CEO袁征都是美籍华人。

美国的开放性，对全球优秀人才有着极强的吸引力，这成为他们的创新动力，五湖四海的人聚集在这里，都有一个美国梦，这也是美国强大起来、发展很快的最主要的原因之一。

我先后在英国和美国留学、工作，有切身的比较。美国和英国或欧洲传统的社会不太一样。英国比较传统，大家更加重视传统也比较循规蹈矩，很多不愿服从当地社会文化规范的人，早就选择来到美国。我上世纪80年代在英国爱丁堡大学读博士期间，没有毕业前就去了美国的卡内基梅隆大学。我英国的博士老师对我说，美国人做的研究就是世界一流的，你应该去更大的世界看看，开开眼界。他觉得英国那边人的天地还是比较小的。在我论文选题确定前，老师就资助我到美国游历，这可以讲对我一生的发展起了决定性的作用。我相信在这边工作和发展的各种族裔的人，包括许多杰出的华人，都会有这种感受。

《科学大师》：国内就有人问，ChatGPT为什么会出现在美国，而不是出现在中国？一流的科研创新，目前是美国居多，别人只能是跟跑，为什么出现这个局面？

黄学东：这个因素太多了。第一，我刚才讲美国是一个非常有吸引力的开放型国家，很多元化，不管你是什么种族，只要是优秀人才，你都可以在这里找到一席之地，他不会排斥异类，所以优秀的人比例很高，可以讲美国聚集了全球最聪明的头脑。

第二，美国的经济基础和财力也非常强大，它现在还是世界第一大经济体，它有充分的物质条件支持科研投入，支持大家去搞研发创新，它养得起这些人。

第三，美国也是一个比较年轻的国家，还不到三百年，它没有历史上的很多包袱，没有太多的束缚，做事情能放得开手脚，也不去束缚大家的思想和创新活力。而欧洲很多国家，由于历史原因，遗留下来很多东西，有太多传统的框框，他们有很多的约定俗成。

第四，美国的企业和高校交流互动非常好，人才的流动比较通畅，我就是从卡内基梅隆大学去的微软，大学和企业的合作关系是很密切的，微软的研发团队，有很多人都是从全球顶尖大学出来的，相互结合，这也支撑了企业的研发创新，使得像贝尔实验室、 IBM当年的沃森研究中心（Watson Research Center）、微软研究院，这些研发团队一代接一代，长江后浪推前浪，都非常优秀，都对社会做出了大的贡献。

第五，美国的文化中，没有成王败寇这回事，他们的价值观反而是鼓励失败、宽容失败的。创新之路必然有失败，而且会有很多的失败。你只有从失败中才能走出一条可行路径。这是所有成功者都必定经历过的。

我说的这些因素，还不完全充分，但我认为，归根结底，一种自由、多元、开放、包容的文化土壤，对于原始创新和应用研究活力的激发，是不可或缺的。美国的科技实力能够全球领先，我想是得益于这一点。

五，如果你想成为优秀的人才，不妨听我一言

《科学大师》：如果要您对中国的大学生和年轻人一些建议，帮助他们更好地成长和发展，您会对他们说些什么？

黄学东：我读的第一所大学是湖南大学，后来考到清华读研究生，然后是到英国读博士和在美国做博士后。先后经历了四所大学，再进入卡内基梅隆大学和微软工作。我就觉得，人的一生，一定要读万卷书行万里路。我们中国传统文化里面其实都有讲这个，但在实践中可能会受到各种条件和因素的限制。

我领悟到了中国的传统、欧洲（英国）的传统、美国的传统，正因为我受到那么多不同文化的熏陶，有些东西可以讲是终身受用。我给中国同学的一个建议是，你千万不要固定在一所学校读下去，本科、硕士、博士最好是读3个学校，这样至少你就有3个学校的校友群，然后你博士后也要换1个地方，至少有4个学校的校友，那你校友多朋友就多了，你的思维、视野就开阔了。

很多学生本科、硕士、博士都在一个学校读，我不是说一个学校不好，但是你为什么不换几个学校呢？中国那么多优秀的学校，或者你到欧洲、美国等国外学校读，全球有那么多的好学校，读万卷书行万里路，这是一个很好的办法。

我曾跟我的本科母校湖南大学的学生座谈中还提到这么几点，我愿意分享给更多年轻人：

1，创新很难教会，也没有普遍的适用原则，从今天开始你就要找更好的人交流，并进行更多的脑力激荡，然后在创新中快速迭代。

2，出色的执行力比好的点子难很多。我们需要既有执行力又有好点子。一个坏主意能让最优秀的执行力一事无成。毅力源于你学会了在被打倒后重新站起来。专注是提高创新力和执行力的倍增器。

3，要勇于冒险，不敢冒险只会取得平庸的成就，在你个人的职业和生活中，每年都要尝试一些重大、新颖和冒险的决定。有很多人精于算计，不敢冒险，我是湖南人，我觉得湖湘文化非常好，就是做人做事要敢为天下先，敢于冒险和尝试，同时要实事求是，追求经世致用。

4，出色的创新力和执行力可以让你变得富有，要想富有你必须培养自己拥有价值并且能够迅速增长的东西。这可以是企业、房地产、自然资源、知识产权或其他一技之长，仅仅出卖自己的时间，这只是线性增长，而且随着逐渐老去这会不可持续。

5，不要一味追逐身份地位，空有这些而缺乏实质内容是不会长久的。当你取得想要的成就后内驱力就是唯一的动力，它会推动你向更高的地方攀登，内驱力会让你努力学习新的东西，增加你的幸福感，使生活更有趣，而能防止思想僵化和老年痴呆。

我当年在清华读研的时候，就觉得跟计算机交流太困难了，要是能用自然语言的方式就能解决这个问题，多好。今天不管是ChatGPT还是语音识别，这个愿望已经达到了，但这还不够。要知道，这个地球上有7000种不同的语言，我们要让这个世界变得更好，让交流更理想，我们就要支持这7000种语言，何况这世界上每天都有某些小语种消亡，因为大的语言讲的人多，不会有问题，怎么让不同语言的人自由交流，是个很大的挑战，所以这就是我的内驱力，要让人工智能帮助大家实现更好的无障碍的交流。我们生而为人，一定要有理想有追求。