未经许可不得转载,务必保留原文出处链接和公众号按钮

关注本城公众号并设星标,不错过最新精彩内容

文:Web3天空之城·城主

打开网易新闻 查看精彩图片

对于那些我不认识的人,我叫丹·莱文,是博物馆的首席执行官,已经在这里工作了大约六年半。今晚的节目让我特别兴奋,因为它与我们的新使命完美契合,稍后我会详细介绍。但首先,我想感谢所有的成员、受托人、支持者、志愿者以及组织这些节目的工作人员。没有你们的支持和帮助,我们无法做到这一切,所以感谢大家。

今天我们这里几乎座无虚席,并且正在进行在线直播,欢迎远道而来的观众。如果你不知道,博物馆大约六年前就制定了它的使命。我们将继续像所有收藏机构一样收藏和保存,为子孙后代而努力。但我们也非常关心人类,因为起初人类是计算机的创造者,后来我们发明了计算机。现在没有计算机,生命就无法想象。因此,该机构的使命已经演变为解码技术,解码计算的过去,从中获得启示;数字化的现在,这是一个不断变化的目标;以及未来对人类状况的影响。

今晚的节目将从个人角度深入探讨这一点。我很高兴欢迎李飞飞博士参加今晚的节目。她在《我眼中的世界》一书中的故事在个人层面上非常深刻,以世界级和权威的专业水平讲述了计算对人类状况的影响。我们确实相信所有这些技术都可以用于更大的利益,这也是我们在该机构的目标,即帮助人们认识到并考虑如何最好地利用这些技术来造福社会。

我还要感谢今晚的赞助商帕特里克·J·麦戈文基金会。我们无法大规模开展这类项目,麦戈文基金会一直是一个了不起的支持者。帕特·麦戈文不久前去世了,他是这个博物馆的创始董事之一,他的家乡是波士顿,博物馆最初就是在那里建立的,显然在20多年前搬到了湾区。所以我们要感谢他们对人工智能和人类状况系列的支持。

事不宜迟,我想你们来这里是因为你们对人工智能和人类状况了解很多,或者你们有兴趣了解更多。让我先介绍一下李飞飞的背景。她是斯坦福大学的红杉计算机科学教授,也是斯坦福以人为本的人工智能研究所的Denning联席主任。她曾担任斯坦福大学人工智能实验室主任,休假期间担任谷歌人工智能和机器学习首席科学家副总裁。在那段时间里,她也做了大量的研究。她还在国会和白宫委托的国家人工智能研究资源工作组任职。所以,请允许我欢迎李博士上台。

谢谢,丹尼斯。汤姆·哈利尔将主持本次对话。很久以前,我有幸在白宫科学、技术和工程办公室工作时认识了汤姆。他在技术和政策方面经验丰富。在奥巴马政府期间,他曾与克林顿政府和奥巴马政府合作,在政策领域拥有丰富的经验,并在国家纳米技术计划和大脑计划中积极工作。他现在是复兴慈善组织的首席执行官,这是一个新组织,专注于考虑这种新的复兴。我们正在经历这种复兴,在许多情况下,我们正在社区中创造这种复兴。所以我要为此感谢汤姆和feifei。感谢大家参加这个节目,和我一起欢迎他们上台。

谢谢。好的。每个人都必须冲出去买这本书,也给你的朋友和亲戚买一些。这是一本很棒的书。所以飞飞,我们必须看看这个观众有多书呆子。那么你们中有多少人可以向别人解释随机评级、异议和反向传播是如何工作的?举手。好的。

飞飞,你在书中谈到的一件事是关于人工智能的历史。所以,我想知道你是否可以从1956年发生的事情开始?当时的研究人员花了多长时间才意识到他们能够解决人工智能问题?

好的。首先,谢谢你。谢谢计算机历史博物馆。谢谢Daniel和Tom邀请我。我想对那些庆祝农历的人说,今天是中秋节快乐。好的。现在,让我们回到1956年。那不是达特茅斯研讨会,对吧?

是的。

李飞飞:好的。我以为那是1959年。好的。所以,我的记忆已经模糊了。所以,在座的有真正的历史学家。我知道。1956年,达特茅斯学院一个闷热的夏天。人工智能的创始人约翰·麦卡锡、马文·明斯基、克劳德·香农。第四个人是谁?还有一个人。对不起。我们会记住这一点。此外,还召集了一群计算机科学家,我想是在DARPA的一小笔资助下,讨论未来的计算。当时,约翰·麦卡锡刚刚开创了这个领域,称之为人工智能。他们在那个夏天的研讨会上撰写了一份关于人工智能是什么的白皮书,探讨了人工智能的功能、解决问题的方法,特别是推理和演绎推理,试图让机器像人类一样思考、回答问题、做出决定。

这是一段相当漫长的旅程,已经有70多年了。我们经历了起起落落,见证了多次炒作周期。比如在20世纪70年代,关于专家系统的炒作周期,当时开始看到在人工智能中使用一阶逻辑和专家系统的实际应用。但后来那个泡沫破灭了,因为它没有实现。当时有杂志封面谈论机器人接管社会,但这并没有实现。资金真的枯竭了,学术界和工业界的资金都枯竭了。虽然军事资金或国防资金仍然存在,但一些研究人员实际上避开了这些资金来源。总的来说,整个领域都萎缩了。

到了20世纪90年代,人工智能领域开始发生一场静悄悄的革命。虽然公众仍然将那段时期视为AI冬季,但我个人认为那是初春。David Plylar, Jr.:所以绿芽萌发。没错,雪还没有完全融化。这场革命首先是由统计建模驱动的。统计建模与计算机编程相结合,我们开始称之为机器学习。人工智能和机器学习领域找到了自己的语言,通过统计和机器学习,开始破解自然语言编程、计算机视觉、语音识别等各个领域。研究人员开始以相当深入的方式研究这些领域。

就我个人而言,我在2000年进入加州理工学院攻读博士学位,进入人工智能领域。很多公众仍然认为那是AI冬季,但对我来说,在我攻读博士学位期间发生了两件事,这两件事定义了我这一代人工智能研究人员。一个是统计机器学习。我在研究生院的第一堂课,实际上是我走进的第一堂课,叫做神经网络和模式识别。我们阅读了反向传播的论文,同时也研究了支持向量机、贝叶斯网络、增强方法和核方法等。这是我们经历的一部分。我们利用这些工具开始研究计算机视觉等人工智能问题。

然而,我认为在我们的实验室和学术界之外,互联网在人工智能的发展中起到了决定性作用。谷歌大约在1999年或2000年成立,互联网开始为我们提供数据。大约十年后,GPU开始出现,事情逐渐趋于一致。我认为,2010年至2012年左右,人工智能的公共时刻真正到来。至少在硅谷,当谷歌和其他公司试图收购一家可能甚至没有名字的小型初创公司时,公众开始关注它。这家初创公司来自多伦多大学,赢得了ImageNet挑战赛。从那时起,我们进入了现代人工智能时代,人工智能迎来了重生。

对。你参与的一个项目在改变人们对可能性的看法方面发挥了非常重要的作用,那就是ImageNet。你和同事们创建了一个包含1500万张照片的数据集,并给它们贴上了标签。为什么这在帮助启动现代人工智能浪潮中发挥了如此重要的作用呢?

对。对于那些不知道的人来说,ImageNet是一个数据集项目,始于2006年,花了几年时间,于2009年发布。它成为人工智能领域最大的一个数据集,由1500万张互联网图像组成,经过人工分类、整理、组织和分类,涵盖22,000个自然物体类别。在我们发布ImageNet作为开源数据集后,我们立即让研究界参与了年度ImageNet挑战赛,邀请全球的机器学习研究人员和计算机视觉研究人员参与这个我们称之为物体识别的年度挑战赛。

这项年度挑战赛始于2010年,并于2012年取得了成果,那一年挑战赛的第一名就是现在众所周知的AlexNet。这是多伦多大学研究人员的成果,包括Geoffrey Hinton、Ilya 和Alex 。那一刻对人工智能世界来说具有象征意义,因为现代人工智能的三个基本要素汇聚在一起。其中之一是首次聚合的能力,那就是神经网络。这就是 Tom 考你反向传播的原因,因为那是神经网络的底层数学。所以第一个元素是神经网络。

第二个元素是使用 ImageNet 的大数据。第三个元素是 GPU 计算。当时,有两个 GPU。ImageNet 的重要性在于,它在今天看来微不足道。每个人都知道人工智能是由数据驱动的,但在 ImageNet 之前,人们不相信数据。每个人都在研究完全不同的人工智能范式,只使用少量数据,有时甚至没有数据,就像手工制作的特征工程。

这个非常激进的想法是,从头开始就拥有了所有这些,在数据模型中使用数据,用数据驱动的方法驱动高容量模型,并推动人工智能的泛化。许多人对此深表怀疑。因此,没有这种观点,认为神经网络是一种通用函数逼近器。如果你给它们足够多的例子,它们就可以在输入之间进行映射,学习一个在输入和输出之间进行映射的函数。

这不是主流观点。很多更资深的同事都想知道你为什么这样做。我认为这是一个很好的例子,如果你相信某件事,有时候你应该坚持做下去,因为它会产生巨大的影响,即使你当时没有得到同事们的喜爱。

我并不是从消极的角度写的。我认为这是科学进步,就是受到挑战,无论是你的前辈、后辈还是你的学生。我不断受到学生的挑战。我可能每天都有 99 个愚蠢的想法,也许偶尔会有一个好主意。受到挑战是件好事,因为这是一个未经检验的想法,所以没关系。

特别是对于年轻人来说,仅仅因为你受到挑战并不意味着你应该放弃。所以这是这里重要的一课。

那么,从 2012 年到 2024 年,您认为在此期间我们取得了哪些最重要的进展?在人工智能领域,对。信不信由你,2012 年也是 Jennifer 怀疑的同一年,她的同事发现了 CRISPR。2012年是一个重要的年份。当时我与人讨论,发现同年出现了两项重大科学技术突破。从2012年到现在,已经过去了12年,这期间发生了许多重要事件。

在这个领域,尤其是更多的研究领域,我认为Alex和ImageNet的出现是一个重要时刻。它为先驱者打开了大门,包括像谷歌这样的科技公司,开始加倍投入深度学习。这标志着深度学习时代的开始。

2016年1月,AlphaGo与围棋大师李世乭对战并赢得比赛,这是一个公开的时刻。我认为那是公众第一次意识到机器足够强大,可以在人类认为只有我们才能完成的任务上挑战人类。此外,它还引入了一种称为强化学习的新算法,这种算法位于深度学习之上。

从2016年到2022年,对人工智能、大型科技公司和创业的投资逐渐增加。这段时间也与技术冲突的首次出现相吻合。对于我们很多人来说,技术冲突发生在剑桥分析公司事件之后,也就是2016年大选期间。那时,机器学习偏见被指出,自动驾驶汽车死亡事件也在2017年左右发生。因此,我们开始进行社会对话,在对技术的兴奋与对技术的担忧之间产生紧张关系。

所有这些都积累在2022年10月底,当时ChatGPT出现了。对于我们这些研究人员来说,我们看到了这种情况正在发生。你可能会认为我在虚张声势,但我会告诉你为什么。作为斯坦福人类中心研究所联席主任,我们在2021年成立了世界上第一个基础模型研究中心,因为我们看到了GPT-2的结果。当时,公众还没有意识到,但像我们这样的研究人员已经意识到这一点。我的同事Persi Leong和Chris Manning也意识到,这种情况将会改变。所以我们立即投入资源组建这个中心。

当ChatGPT出现时,我们很庆幸我们开始了这件事,但我们也对媒体关注度的上升感到震惊。我认为,AlphaGo时刻和ChatGPT时刻在公众意识方面的差异不仅仅是人数的问题。这是人工智能第一次如此亲密地掌握在个人用户手中。AlphaGo并不在围棋大师以外的任何用户手中,但ChatGPT就在你指尖。这是一个觉醒的时刻,不仅对每个人来说如此,对政府来说也是如此。

在ChatGPT之前,我们研究所的部分使命是弥合技术世界和政策世界之间的差距。所以,你在华盛顿,我不会自然而然地一直飞往华盛顿,但我去华盛顿只是为了继续对话。但在ChatGPT之后,华盛顿就像在召唤我们一样。就像,发生了什么事?没错。所以,我认为这10年真的……我的意思是,公众将其视为离散的事件点。我们认为这是一个连续的过程,只是越来越多的投资和运动。

研究界是否仍在争论这些大型语言模型是随机鹦鹉还是它们有实际的推理在进行?是的。那么,你对这场辩论有什么看法?我理解你为什么使用“随机鹦鹉”这个词,因为它来自一篇批评大型语言模型的论文。我认为重要的是要认识到我们确实需要从不同角度批评这些模型,包括其能力、能耗、局限性、偏见等等。

但我不会称它为“随机鹦鹉”。从科学的角度来看,我认为重要的是使用更中性的语气,而不是称它为上帝或鹦鹉。它确实是一个大型模型,不仅具有模式匹配、模式学习的能力,而且还具有预测能力,并且能够展示某种程度的推理能力。因为它能够向你解释事物是什么。我知道几天前刚刚发布了一个新版本,我个人还没有时间测试它。它将推理能力提升到了另一个阶段。所以我认为可以说它确实具有模式识别能力,有些人可能称之为鹦鹉学舌的能力,但它也具有一定程度的推理能力。

作为一名教育工作者,我总是非常小心,不要夸大这种推理是什么,包括一些更夸张的推断,比如感知或意识。那么,在未来三到五年内,你认为可能会发生什么?你认为目前存在的系统最大的局限性是什么?你认为我们可以更好地利用哪些领域?我们如何才能在提高其性能方面取得真正的进展?

汤姆,我不确定你是在狭义地问语言模型还是在问人工智能。

不,是关于一般的人工智能。

好的。例如,有些人认为,只要购买更多 GPU,我们就能取得令人难以置信的进步,比如购买两百万个 GPU 而不是两个 GPU。还有,更多的数据,更多的合成数据。

我们知道,Transformers 和注意力机制是当前技术的核心。有些人认为,只要扩大现有的技术规模,我们就能取得令人难以置信的进步。还有一些人认为,今天的人工智能版本有根本性的局限性,我们将不得不探索新的方法,比如神经符号方法或类似的东西。那么,你对这场辩论有什么强烈的看法吗?

嗯,首先,所有的观点都有其合理性。事实上,我确实认为我们正处于一场真正的人工智能数字革命中。未来三到五年将继续是技术非常令人兴奋的时期,但也会给我们的社会(包括政策)带来紧张局势。

您所问的更多是技术方面的问题。首先,我从根本上相信,在人类历史的每一个阶段,技术和科学都是有限的。我们总是可以推动前沿向前发展。就我个人而言,我对空间智能感到非常兴奋,这远远超出了语言的范畴。如果你看看人类和动物的智能,语言只是智能的一部分。即使我们研究的是高级智能,人类也已经建立了超越语言的文明。从金字塔的建造到第一次工业革命的机器的复杂设计,DNA结构的发现,电影摄影的创造等等,其中很多都是建立在超越语言的空间智能之上的。所以,除了语言之外,肯定还有新的大门打开了。

从技术上讲,数据的缩放定律仍然有效。我们仍然看到数据缩放定律的非常健康的证据。但同样非常有趣的是,我们越来越多地听到关于我们在何处达到数据极限的消息,尤其是互联网上基于文本的数据。我们很可能已经到达极限。但就我所处的高等教育领域而言,我还看到,在很多科学发现领域,数据甚至还没有得到妥善收集。从这些数据的数字化到这些数据的建模,我认为在未来三到五年内,由于人工智能和机器学习,我们将看到不同领域的科学发现蓬勃发展,不仅仅是大型基础模型的商业化。我们将看到更多的空间智能。我个人参与其中,并对此感到兴奋。未来三到五年不仅仅是技术发展的岁月,也是我们如何部署和管理这些模型的关键时期。

在加利福尼亚州,正在讨论人工智能法案。就我个人而言,我既支持安全措施,也支持政策措施。但我也担心,即使是善意的法案也可能对科学和开源社区产生意想不到的负面影响。这一切肯定会在未来三到五年内显现出来。

我想回到政策问题上,但首先请你为观众多描述一下你所说的空间智能。计算机能够看、做和学习意味着什么?我们如何知道我们在空间智能方面是否取得了进展?

你在斯坦福大学的一位同事切尔西·芬恩说,我们距离让机器人出现在它从未见过的房子里还很远。那么,比如说,距离吃早餐还有多远?非常远。我等不及了,但还很远。

追溯人类语言的发展,这仍然是一个科学研究领域。人类语言历史上最早的原始语言大约是在一两百万年前被发明的。很多人说我们今天使用的语言是在过去30万年内发展起来的。

但是,如果追溯到观察空间、三维世界、了解正在发生的事情,观察障碍物、观察食物、了解如何导航和推理的能力,它可以追溯到5.4亿年前。那是水下动物世界首次发展出光传感器的时候。有了这种能力,感知就开始了。动物开始以一种专注的方式移动,而在那之前,它们只是漂浮着。它们可能触摸了一些东西,因为早期有触觉传感器,但那非常非常冷。

一旦你能看到,你就开始发展空间智能。你开始规划你的生活,开始看到食物,开始躲起来,不成为别人的食物。而智力的进化过程才刚刚开始。

空间智能总结了所有这些能力。用今天的话来说,它是理解、推理、生成和与3D世界互动的能力。现在,我们同时生活在物理世界和数字世界中,这种空间智能适用于这两个世界。

如果你想要一个可以到你家做早餐的机器人,机器人需要具备的最重要的能力之一就是空间智能。因为机器人需要知道你的冰箱在哪里,炉子在哪里,鸡蛋在哪里,如何打开鸡蛋并把它放进锅里等等。这些都是空间智能的一部分。

关于人工智能的概念有很多讨论。我想知道你是否认为这是一个有用的概念。人们通常认为这将是可能的。也许让我们把机器人放在一边,因为那有点遥远。但是,如果你想象一个远程工作者,你将能够拥有一个人工智能,它可以做人类所做的每件有用的、经济上有用的事情,我们就可以用一些AGI来做。

首先,您认为这是一个有用的概念吗?第二,有些人说,哦,那将在三年内实现。你认为这有点过于乐观吗?

这是个好问题。这也是一个硅谷问题。这就是我们现在的处境。有时在我的脑海里,我会与人工智能的先驱约翰·麦卡锡、马文·明斯基,还有艾伦·图灵进行对话。他可能不会称自己为人工智能的先驱,因为当他向人类提出思考机器的问题时,最终转化为图灵测试,他还没有考虑人工智能这个词。它还没有被发明出来。

但当我与这些巨头对话时,我认为他们对人工智能的定义会非常相似。它是智能的一般能力。因此,如果他们这样称呼AI,那么作为一名学者,我很难区分AI和AGI,因为我认为它们有很大的重叠。如果你看看AGI这个术语的出现时间,那可能还不到10年。它更多地来自行业,行业营销世界。这没有什么不好的。

但从学术、科学、技术研究人员、教育工作者的角度来看,你们中一些读过我书的人知道我经常使用北极星这个词。作为一名科学家,我们追逐那些我们一生中可能永远无法解决的最难问题,但它们激励着我们。我认为,人工智能领域的北极星始终是那种通用能力。那么,我对AGI(通用人工智能)这个词有什么看法呢?没有人问我他们什么时候发明了这个词。没关系,但我们热爱并仍然相信的人工智能领域与这个定义在很大程度上是重叠的。

现在,三年后,我们会实现这一目标吗?如果我站在风险投资家面前,我当然会说是的。但实际上,你不会这么说。所以我认为我们需要负责任。这意味着什么?机器会在重要任务上超越人类吗?我们已经在一些任务上做到了。

例如,2006年,DARPA的无人驾驶汽车大挑战中,我的同事Sebastian Thrun和他的团队驾驶一辆汽车在内华达州的沙漠中行驶了138英里。这是一种令人难以置信的能力。然后我们有可以翻译数十种语言的机器,这简直是超人般的能力。我们在很多任务上已经超越了人类,比如AlphaFold和AlphaGo。即使是ImageNet,也有1,000个神秘的物体类别,比如星鼻鼹鼠和各种种类的狗。这些都是超人的能力。

所以我认为我们已经取得了一些成就,并将继续取得更多成就。但是,如果没有明确的定义,我不相信在三年内我们能实现像人类一样聪明、像人类一样错综复杂的整体性。

那么,让我们来谈谈你在斯坦福大学以人为本的人工智能计划中所做的工作。首先,您所说的以人为本的人工智能是什么意思?这个问题问得很好。我认为,以人为本的人工智能对我来说,是一个思考我的、你的人工智能工作的框架。因为人工智能是由人制造的,由人使用,将影响人们的生活,那么思考这项技术的指导框架是什么呢?

在2018年3月,我还是谷歌的首席科学家时,我写了一篇《纽约时报》文章,将这一框架称为以人为本的人工智能,正是因为我在谷歌的工作给了我很大的启发。我有机会与许多企业进行交流,从日本的个人开发者、使用人工智能的黄瓜种植者,一直到希望利用人工智能彻底改变整个商业模式的财富50强公司。我意识到这项技术比我想象的任何东西都要大。这项技术将以如此深刻的方式影响我们的生活、企业和世界,这种认识实际上让我不寒而栗。意识到一个工具可以如此强大是令人恐惧的,我们最好考虑一下其中的含义。

对我来说,这种深刻的含义必须植根于人类的意义。当我想到这一点时,我和斯坦福大学的同事们就提出了一个观点:我们需要用以人为本的框架来处理人工智能。在斯坦福大学 HAI,我们用三个同心圆来思考人工智能对人类的影响:个人、社区和社会。

首先是个人层面。这项技术对每一个人有什么影响或好处?如果你是一名艺术家,你是如何利用它来增强你的创作?还是它剥夺了你的知识产权?如果你是一名病人,这项技术是否让你在不剥夺你的人格尊严的情况下更好地康复?如果你是一名学生,你是如何通过这项技术的帮助学习你感兴趣的任何内容的?这些都是对个人的影响。

接下来是社区层面。如何利用人工智能作为工具来帮助资源不足的社区?例如,对于那些无法去医院就诊且医生不足的社区来说,人工智能加远程医疗是一个非常好的用例。同时,有偏见的人工智能是否会对一个社区产生比另一个社区更大的影响?我们已经看到了这一点。

最后是社会层面。今天我们不能停止谈论人工智能在 11 月的影响。我们的民主进程、人工智能、深度伪造和信息战将如何改变这一切?我们不能停止谈论工作,从软件工程到卡车司机再到放射科医生,人工智能正在影响整个社会。

所有这些都是人类的问题。数学是干净的,但人类世界是混乱的。人工智能已经从拥有干净数学和编程的世界进入了混乱的人类世界。有人曾经说过,技术很容易,人类很难,尤其是小孩子。

您最期待的人工智能在环境健康等方面的潜在优势和应用有哪些?谢谢你的提示,因为这是我书的第 10 章。确实,这个领域真的是无边无际的。就我个人而言,我非常受启发,因为我的父母病得很重,已经病了几十年。我在初级保健、急诊科、手术室外和门诊护理环境中度过了无数个小时,照顾我的母亲。这让我意识到,我们的医疗保健系统充满了照顾他人的人。然而,这些医疗工作者——从护士到医生再到看护者——他们没有足够的时间和帮助。

因此,医疗保健环境中的环境智能实际上是我和斯坦福医学院的同事之间合作的产物。我们希望利用技术提供额外的眼睛和耳朵,帮助医生、护士和看护者确保病人的安全,防止他们的情况迅速恶化。

例如,很多人的家人和朋友都曾摔倒过。这是一种非常痛苦且代价高昂的伤害,尤其是对老年人来说。那么,如何预测这种情况?如何发出警报?如何帮助他们?如何帮助我们的老年人或患者?让一个人24小时看护很难,但电脑和摄像头可以提供帮助。环境智能可以帮助监测COPD患者的病情,并在氧气快速变化或某些情况发生变化时提醒医生。

这只是人工智能几乎成为守护天使的一个例子,它可以增强我们的看护者,照顾人们。我们在教育和个性化学习中也看到了令人兴奋的用例。人工智能可以成为导师、助教,在不同的学习环境中成为老师的助手。我记得你的一位前研究生安德烈正在研究这个问题,我几天前才见过他。

不仅如此,农业领域也有很多用例。几年前,在深度学习革命开始之前,我曾有一个学生与他人共同创办了一家初创公司,使用计算机视觉技术检测田地里的杂草,从而让农作物更健康。我还听说鲑鱼养殖户使用人工智能来帮助养殖鲑鱼。人工智能的积极用途不胜枚举。

那么,我们如何才能让更多的人既拥有计算背景,又成为领域专家呢?例如,你的同事Daphne Culler有机器学习背景,但她也学到了很多关于医疗保健和药物发现的知识。在我看来,那些在计算专业知识和领域专业知识两个领域都有涉猎的人将能够帮助识别更多这些引人注目的用例。

这是一个很好的观点,汤姆。我深信跨学科和多学科方法的重要性。即使你不想获得交叉领域的博士学位,我个人是在人工智能和计算神经科学的交叉领域,或者人工智能和计算生物学的交叉领域,或者人工智能和政治学的交叉领域获得的知识。即使你没有博士学位那么深入,跨学科的知识仍然非常有价值。在你作为学生的整个旅程中,拥抱计算、STEM领域以及你热爱的领域(无论是生物学、艺术、政策还是化学等等)都具有很大的价值。

对于在校学生来说,无论你是在学校、考虑上大学还是已经在大学,我认为汤姆所说的真正有价值的是拥抱这种跨学科性。

从广义上讲,人工智能是计算的新语言。我曾说过,只要有芯片的地方,就会有或将会出现人工智能。小到装有芯片的灯泡,大到机器人、汽车等等,都会有人工智能。

鉴于这项技术的重要性,我确实相信要从小教育我们的孩子,教育来自不同背景、各行各业的学生,教育我们的公众这项技术,至少如果不是编码,也要知道这是什么。

即使你的热情不在计算、计算机编程或人工智能的技术细节上,如果你的热情在艺术上,或者在政治学、法律、医学上,你也会有一席之地,因为领域专家将使用人工智能在你的领域做出改变。所以不要害怕从你的角度接受它,并用它来做出积极的改变。

人们列出了很多潜在的风险。你已经谈到了一些:人们将会失去工作,人们会利用深度伪造来扰乱选举,现有的偏见会进一步加深。有些人有更多推测性的担忧,比如工具收敛的想法。如果我们给人工智能系统一个目标函数,即试图实现某个目标,那么它就会有子目标,想要复制自己并获得更多的计算能力。

在这些风险中,我最重视的是哪种风险?是的,风险很多。每一项技术,每一项强大的技术都可能造成伤害,被用于伤害,即使是善意的也会产生意想不到的后果。我们必须面对这一点。

但如果你强迫我选择一个风险,作为一名教育工作者,我会说拥抱人工智能新时代的最大风险是无知。这不仅仅是基本的无知,比如不知道如何拼写人工智能这个词。即使是一些学识渊博的人,当他们忽略细节和细微差别,并以夸张的方式传达人工智能时,也会对社会构成风险。

如果我们对这项技术太无知,我们就会错过利用它为自己谋利的机会。如果我们对这项技术无知,我们就无法指出或认识到实际风险。如果我们传播无知的信息,我们也在误导公众或政策制定。

这些问题的根源实际上源于缺乏了解,所以我们没有正确评估风险,或者我们夸张地传达它,或者我们完全错过了它。这就是我的意思。

你现在看到哪些例子,人们说的话你认为完全不着边际?

好吧。

我认为,任何说人工智能都是好的人,就好像在说技术都是好的,它只会带来好处,永远不会做坏事。我认为这是对过去的无知。回顾人类使用工具的历史,每一种工具都被用于有害的地方。因此,我们必须认识到,如果你的数据集有偏差,那么在公平性方面,你会受到非常严重的下游影响。如果你不知道人工智能在哪里、如何制造,那么你可能真的太无知了,在不知情的情况下使用深度伪造。这些都不好。

但还有另一个转折点,那就是,这是一个恶魔,它的存在危机,它会自我扩散、自我复制,关闭电网等等。此外,我认为这是夸张的,它忽略了人工智能不是一个抽象的概念,它实际上存在于物理系统中。即使它是虚拟软件、数字程序,它也存在于物理系统中,它存在于数据中心,它存在于电网中,它存在于人类社会中。有太多的东西是相互联系和情境化的。

但是,提出这些更具推测性的担忧的人中,有些人是像杰弗里·辛顿(Jeffrey Hinton)这样的人,他们大概了解这项技术。那么,你为什么认为,过去几年,那些深入参与这项技术的人变得更加担忧?

首先,杰夫,我非常非常尊重杰夫。我从读研究生的时候就认识杰夫了。实际上,去年我在多伦多,我和杰夫·辛顿就这个问题进行了公开讨论,视频在 YouTube 上。我认为这是杰夫和我,或者杰夫和任何人就这个问题进行公开讨论的极少数几次之一。如果你仔细听他说话,你会发现他很担心。他还指出了潜在的风险。

但是,他的担忧还有一层放大。我们必须分开。我完全尊重与 Jeff 的讨论。我同意他的观点。不负责任地使用这项技术将会导致非常可怕的后果。他对不负责任的使用有自己的看法。我有自己不负责任的使用版本。我还认为,我尊重每个人以自己的方式呼吁这些风险。但我也想成为一名负责任的传播者和教育者。我想让公众知道,驾驭和管理这项技术仍然是我们人类集体的责任。对,而且绝对有,不仅仅是时间。绝对有时间。还有,你知道,我们所做的一切都是在我们手中。我们不应该放弃。

对,所以你谈到了治理。您在将国家研究云的想法纳入政治议程方面发挥了非常重要的作用。如果您确实有机会向下任总统做简报,而他们问您,feifei,我该怎么办?关于美国最重要的事情,您会给下一任总统什么建议?政府可以做些什么来努力促进利益,同时也了解和管理风险?

对,我可能会说去年6月和今年早些时候我对拜登总统说的话。我在国情咨文演讲中遇到他时,我相信我们的国家需要一个非常健康的人工智能生态系统。当我说它是一个生态系统时,它包括公共部门、学术界和企业家精神。我们现在称小科技和大科技为技术。

我们的国家是一个非常强大的民主国家。我们相信这种民主的价值。我相信拥有健康的人工智能生态系统可以发挥我们的优势,并且可以发挥非常积极的作用。但是,我们可以做些什么来尝试?公共投资。是的,公共投资。公共投资真的非常重要。

现在我部分在私营部门工作,这让我更加确信私营部门投资和公共部门对人工智能的投资之间的差异是如此巨大,对吧?就像我的斯坦福……我与其他几位教员共享的斯坦福计算机视觉实验室没有H100。它也没有A100。我们仍在使用A6000和其他较旧的芯片。然而,正如你所说,大型科技公司拥有数十万和数百万个芯片。

我认为公共部门投资是思想花园和鲜花盛开的地方。如果不是公共部门,我们今天就不会在这里,我也不会在这里。还有,Jeffrey Hinton 是什么时候开始研究人工神经网络的?几十年前?是的,他在CMU工作过,甚至可能更早,对吧?ImageNet来自公共部门,你知道,未来三到五年,我们谈论的是科学发现。我们将看到令人兴奋的事情出现,其中很多将来自公共部门。而且来自公共部门、学术界的最好的东西,你猜怎么着?我们的人民,就是这样。所以我们需要投资公共部门。

是的,太好了。好吧,我们的听众非常聪明,所以我相信你已经提出了很多非常好的问题。让我们看看其中一个关于你新公司的问题。你将如何收集足够的数据来构建一个支持实时定位的世界空间地图?显然,数据是关键,没有数据,你将无法在空间智能方面取得进展。也许你可以解决这个问题。

我们尚未公开讨论细节,因为我们还没有准备好。当我们准备好时,我们会的。我觉得有趣的是,有人已经知道我们在做什么了。那是他们的故事版本,我对此不做评论。但你说得对,人工智能是由数据驱动的,这很重要。我们公司的空间智能绝对是基于像素的,因此,大量像素数据将推动这项技术的发展。

这是艾米提出的一个很好的问题,这和你从事的一项工作有关,即全民人工智能。她说:“我是一个12岁的中学生。我们可以做些什么来鼓励更多的女孩学习人工智能,更好地为人工智能时代做好准备?”这是个好问题。我认为应该鼓励每个12岁的孩子接受这一点。不管你是女孩还是男孩,不管你住在农村还是硅谷,如果你喜欢它,就接受它。

对于艾米来说,我12岁的时候还没有人工智能,至少我不知道有人工智能。我喜欢数学和物理。今天,我感激父母和老师对我做的一件事,我会告诉艾米和所有的学生,那就是追随你的激情,追随你的好奇心,保持坚韧。如果有负面的声音,就忽略它。有很多人,从你的父母到你的老师,从你的朋友到你的榜样,都在支持你。继续做下去,继续前进。

除了做早餐之外,用空间智能解决的最重要的人类问题是什么?午餐?不,只是开玩笑。空间智能真的可以为很多事情提供动力,从创造到设计。你们中有多少人只想要一个应用程序,可以想象所有的家具重新布置,机器人、AR、VR,到特定领域,无论是教学、学习、医疗保健、工厂、制造业等等。所以它真的是一种非常普遍的横向技术,可以影响所有这些领域。

我们还有一个关于小模型和AR眼镜结合的问题。这是你考虑过的事情吗?我对新媒体感到非常兴奋。我知道现在还为时过早,对吧?就像我们又回到了硅谷一样。

我相信你们中的许多人都熬夜购买了 Vision Pro,所以我非常兴奋。实际上,苹果称之为空间计算,因为当时我已经考虑空间智能很多年了。我认为,空间计算需要空间智能。虽然目前的形式可能只是眼镜或耳机,但我真的相信眼镜,可能是耳机,但眼镜对我来说非常令人兴奋。

边缘计算或小模型也非常令人兴奋。小模型不仅对眼镜和耳机有用,它对边缘计算非常强大,无论是智能设备、机器人,尤其是家用机器人。你不能在后备箱里携带服务器,对吧?所以小模型有很多用处。

我对多模态模型和智能眼镜在劳动力发展方面可能发挥的作用非常感兴趣。我们没有足够的电工,所以你可以想象那种耳塞、人工智能和智能眼镜,能够提供某种及时的培训,作为学徒计划的一部分,提供足够的培训。

我们能做什么?研究界能做什么?公司能做些什么来解决除英语以外的其他语言代表性不足的问题?这是一个很好的问题。这涉及到数据偏见和所有这些。首先,我确实认为,每个国家都应该有公共部门在人工智能方面的投资。这本身与当地文化、当地语言有关。

从这个角度来看,个人研究人员的关注很重要,但能够部署大量资源的政府和大型组织也应该关注这一点。英语确实占主导地位,我们应该意识到这一点。这又回到了我关于公共部门投资的观点。即使在这个国家,我相信我们也有出色的研究人员和学生在思考其他语言,但现在他们缺乏数据集和计算资源。我们需要解决这个问题。

观众提出了一些哲学问题。我想知道,您是否可以谈谈您为吸引斯坦福人文和社会科学人才而做出的努力。作为一名计算机科学家,他们能够提供哪些让您感兴趣的见解?

实际上,这是我过去五年建立和共同运营这个研究所最有趣的部分,真正影响了整个校园。斯坦福大学有大约八所学院,从法学院、商学院、医学院,到现在的可持续发展学院、人文和自然科学学院、工程学院,与同事交谈,接触校园里的学生、研究人员和学者,非常有趣和富有启发性。### 我学到了什么?

例如,与人文学科的同事交谈确实开阔了我对人类表达和创造力的理解。

我们如何看待人工智能与具有深度创造力的人的关系?尤其是当 ChatGPT 和 Sora 问世时,从好莱坞的编剧罢工,到对声音、艺术家、个人版权的关注,再到那些走在拥抱这一工具前沿的艺术家,这一切都显得非常复杂。

我没有受过正规教育,甚至无法完全理解这些复杂性,但他们教会了我如何思考。我确实学到了一件事,再次与在座的各位交谈,可能是非常技术性的。我认为技术人员倾听并接触人文主义者和社会科学家非常重要。在您的工作环境中,这可能涉及法律、产品、营销等许多不同的功能。因为技术不是存在于真空中的,需要复杂的人类努力才能使技术变得仁慈和善良。带着谦卑和尊重的态度,给予对方应有的尊严,是我们能做的最根本的事情,以建立这些桥梁。

您认为我们在可解释和可解读的人工智能等领域取得进展有多重要?这是一个很好的问题。我认为总的来说,这很重要。但同样,我们必须进行一些细微的探讨。例如,即使是可解释性也具有不同的层次。

例如,每个人都知道泰诺可以缓解发烧和头痛。但如果让我解释泰诺的分子途径,事实上,即使在今天,科学家也不知道所有的细节。然而,你永远不会说泰诺是一种无法解释的药物。这是因为围绕药物开发、监管措施、批准过程有一个完整的系统,这个系统有足够的解释让你或大多数公众信服并感到信任。

另一种可解释性是,例如,你从拉斐特开车到山景城,谷歌地图会给你选择。这条路线需要付费,但快了四分钟;这条路线风景优美。虽然这并没有向你解释从 A 点到 B 点的算法,但作为人类用户,你会觉得你的选择有足够的可解释性。

再说回医学,我们这些不是医生的人几乎都不了解治疗。然而,你的医生用某种人类语言向你解释这种治疗是什么。我用这个例子来和你分享,思考案例和用例非常重要。思考可解释性的定义也同样重要。特定用例的特定定义确实需要匹配。有时我们不需要机械分子通路级别的可解释性,有时我们需要不同层次的可解释性。所以,回答你的问题,这很重要,但这取决于具体的用例。它在不同的情况下有不同的重要性。

我们有很多观众想了解你为世界实验室制定的商业计划的细节,但我们会跳过这些问题。他们是观众席中的风投。有一个问题是,你提到除了研究人工智能,你还研究神经科学。有些人对这个问题很感兴趣:人工智能能从神经科学中学到什么?

卷积神经网络至少在某种程度上受到了人类视觉系统工作方式的启发。人们研究过多巴胺奖励回路,这是强化学习的灵感来源。你认为神经科学和人工智能之间在其他领域有潜在的合作吗?显然,大自然已经解决了低功耗计算的一些问题,因为我们的大脑只使用20瓦。

当我们成立斯坦福HAI时,三大研究支柱之一就是神经科学。对我来说,神经科学和人工智能之间的跨学科合作是我们领域发展的基础,也是两个领域未来发展的基础。我非常幸运能够与Surya Ganguly、Mike Frank和Noah Goodman这样的同事一起工作。斯坦福大学的许多同事都处于这项跨学科研究的前沿。

例如,幼儿的发展,在早期,孩子们会进行大量的好奇心驱动的学习。这如何转化为人工智能系统?这是一个灵感。我们还知道,反向传播是对我们大脑中两个神经元之间发生的事情的一种非常简单的翻译。除了突触连接外,还有许多树突连接实际上与大脑有着深厚的联系。我们有非常电气、化学和非常微妙的东西,今天的机器学习算法还没有结合这些复杂、新颖、有趣的突触和神经元通讯渠道。

另一方面,我们的神经科学家同事,无论他们使用动物模型还是细胞模型,都在收集大量数据,并使用这些数据进行研究。这就是为什么机器学习或人工智能是一种帮助他们发现科学的迷人方式。最后但并非最不重要的一点是,即使是我的实验室,我们现在也正在与心理学家合作。使用来自人类的非侵入性电脑电波来驱动机器人,这令人着迷。这是一种完全非侵入性的方式。关键在于,这两个领域有很多交叉融合,对我来说,这是跨学科研究最令人兴奋的领域之一。

飞飞,我们有足够的问题让你在这里待到10点。但请和我一起感谢飞飞的精彩采访。谢谢。记住,我看到的世界。是的,这是肯定的。非常感谢你们俩。再次,这是一个很棒的交流,我个人有很多收获。

我认为公众支持确实是一个非常、非常根本的因素。汤姆,你在政府中为这些事情做了很多工作。如果没有公众支持,我们就会不知所措。在这个阶段,很多事情都与社会影响有关。

你要找的人,第四个人……哦,是的,出席达特茅斯会议的是纳撒尼尔·罗切斯特 (Nathaniel Rochester)。当时他在 IBM 工作。我想告诉所有最近没有参观过展览的人,楼下有一台霍勒里斯机器,这是赫尔曼·霍勒里斯 (Herman Hollerith) 在解决美国面临的一个问题后建造的机器。政府曾试图将 1890 年的人口普查编纂成法典。因为人口增长导致人口增加,因此采用的技术无法及时进行人口普查。通过公众号召和私人倡议的结合,他发明了一种基于打孔卡的机器,这种机器是为工业革命时期的提花织机设计和制造的,用于存储所有这些织物和窗帘的图案。

所以我们回到话题,无论是 DARPA 的资助还是其他什么,都需要社会对此的呼吁。如果不是现在,我不知道什么时候。你在台上为大家阐述了一些很棒的想法。我想再次感谢你们两位。请