(关注公众号设为标,获取AI深度洞察)
全文 10,000字 | 阅读约45分钟
【核心内容预览】
GPT-5即将发布:OpenAI正整合GPT和o系列模型,推出更强大的GPT-5;
研发融合创新:研究与产品开发紧密结合,不再是单纯的研究公司;
Deep Research惊艳:被称为"自ChatGPT以来最佳产品",展现AGI潜力;
AI编程提速:预测2026年实现编程99%自动化,比竞争对手预期更早;
教育变革:愿景是AI为每个孩子提供个性化导师,技术已准备就绪;
机器人布局:已开始关注机器人技术,计划从数字世界拓展到现实应用;
在全球AI竞争日益白热化的背景下,OpenAI首席产品官(CPO) Kevin Weil近日接受了一场引人注目的访谈。面对来自中国AI巨头DeepSeek等公司的强大压力,OpenAI已经明确表示GPT-5即将发布,这被视为公司保持技术领先地位的关键举措。
Kevin Weil在访谈中不仅确认了这一消息,还透露了GPT-5将整合目前分叉的GPT系列和o系列模型,将推理能力与大规模预训练模型的优势结合起来。"我们正在努力简化模型系列,尽管我们在命名方面真的很糟糕,"Weil半开玩笑地说道,同时承诺GPT-5将为用户带来更一致、更强大的体验。
在快1个小时的深度对话中,这位曾在Twitter、Instagram和Meta工作过的产品专家分享了他对AI发展速度的惊叹,以及OpenAI如何通过研究与产品开发的紧密融合来保持领先地位。尤其令人关注的是他对AI编程自动化的大胆预测——2026年将实现99%的编程自动化,这比竞争对手Anthropic预测的2027年更早。
文稿整理
主持人:这一集中,我们有幸邀请到 OpenAI 的首席产品官 Kevin Weil 加入我们。Kevin,对于那些可能还不认识你的人,你能简单介绍一下你在 OpenAI 的工作,以及是什么让你如此与众不同?
Kevin Weil:是什么让我与众不同?嗯,我很幸运能担任 OpenAI 的首席产品官,这可能是我职业生涯中最有趣的工作。我的职业道路很幸运,经历了许多不同阶段。早期我在 Twitter 担任工程师,那时公司只有 40 人,后来发展到约 4000 人。我在那里主要负责产品工作。之后我在 Instagram 也担任过产品负责人,还参与创建了 Meta 公司的 Libra 加密货币项目。我还在 Planet 公司花了几年时间建造卫星,那也是一次非常宝贵的经历。但在 OpenAI 之外的其他地方,你对计算机能做什么通常有一个基本认识。构建产品时,你会考虑为谁构建,解决什么问题,但技术本身变化不大。数据库会有所改进,但速度不快。今年的数据库可能比去年的快 5%,但功能基本上是一样的。OpenAI 的与众不同之处在于,每两个月我们就会让计算机做一些全世界历史上从未实现过的事情。你对技术能力的认知会不断刷新,这意味着你几乎每两三个月就要重新思考你的产品。这很有挑战性,但也非常有趣。
一、OpenAI 创造前所未有的产品
主持人:Kevin,你能告诉我们你在 OpenAI 的工作经历吗?OpenAI 既是一家研究公司,又是一家产品公司,你在产品方面的工作是怎样的?很多人都在谈论模型会不断改进,研究方面有很棒的工作在进行,不仅在 OpenAI,也在其他公司。但 OpenAI 作为产品公司,尤其是 ChatGPT,已经抓住了全世界的想象力。现在 ChatGPT 已经成为一个动词,我经常用它来指代使用 AI 工具的行为。那么,你的日常工作是怎样处理这种双重角色的呢?
Kevin Weil:这是个很好的问题。回顾一下,OpenAI 大约 10 年前成立,最初是一家研究公司。一群当时被认为很疯狂的人创立了它,他们说:"我们可以构建 AGI(人工通用智能)。"当时几乎没人相信他们,他们有点像边缘人物。但事实证明他们是对的,他们找到了一些方法,开始构建了一些令人惊艳的演示,比如能解魔方的机器人手。然后他们发现了扩展定律(scaling laws),表明投入更多的计算和数据,模型会变得非常出色。正如你所说,OpenAI 很快成为一家世界级的研究公司。但现在,有了 ChatGPT、企业产品、API 产品以及我们正在考虑的其他产品,我们不能仅仅是一家世界级的研究公司,我们还必须是一家世界级的产品公司。实际上,我越来越觉得我们不能把这两者分开,必须紧密合作。因为就像我之前说的,每两个月,计算机能做的事情就会改变,你对技术的认知也会随之更新。如果我们像两个独立的公司运作,最多只能互相传递一些改进,但这不是构建最佳产品的方式。最佳产品需要研究、产品、工程和设计团队紧密协作,进行深度研究。当你把用户需求、要解决的问题与模型能力的早期突破结合在一起时,魔法就发生了。如果只是互相抛东西,你可能会做出很酷的东西,但不会是最好的产品。市场竞争太激烈了,有很多优秀的公司在构建优秀的模型,我们要赢的唯一方式是真正作为一个整体运作,这就是我们正在努力的方向。
主持人:所以,你的日常工作主要是思考研究的走向,然后确定产品需要加速到哪里,以满足未来的需求,以及规划整个公司在半年或一年后的发展方向。
Kevin Weil:没错。与AI模型合作的一个有趣之处在于,现在的模型已经非常出色,它们不再受智能本身的限制,而是受教学限制。你可以教它们做任何事,但你需要有数据、强化学习和适当的环境来帮助它们做得更好。 实际上,越来越多的产品工作涉及到评估和教导模型做什么。这里面有很多细微差别。比如,如果你用大量的竞技编程比赛数据来训练模型,它会在竞技编程方面变得非常出色,但竞技编程和实际的前端应用开发并不完全一样。你需要非常清楚地了解你要解决的问题,确保你在教模型正确的东西。这是产品反向影响研究的部分。然后,就像你说的,有很多应用场景是由研究推动产品的,有了新能力后,我们会思考如何用它构建出优秀的产品。这就是为什么我们需要两个团队紧密合作,这样才能发挥双方的优势,创造出令人惊叹的成果。
主持人:我明白了,你们在研究和产品之间花了太多时间,以至于没时间给产品起个好名字。
Kevin Weil:哈哈,是的,我们在命名方面确实很糟糕,但我们知道这一点,也接受这一点。我们偶尔会在Reddit上做"问我任何事"(AMA)活动,有一次我和Sam一起参加,有人问我们能不能改进产品命名,我们在房间里讨论了半天,最后我只回了两个字:"不"。我们正在努力实现人工通用智能(AGI),而人们最大的反馈是名字有点混乱,建议我们把所有东西都命名为AGI1、AGI2、AGI3,这样会更简单。不过,我很兴奋,Sam最近提到我们要把模型系列重新整合在一起。历史上,我们有GPT模型系列,从GPT-3、3.5、4到现在的4.5,这些模型是通过越来越大规模的预训练来提升性能的。去年我们在推理方面取得了突破,o1模型系列(包括o1 preview、o1,以及即将推出的o3)能做一些不可思议的事情,它们的基准测试成绩非常高,按照缩放定律,你需要训练一个大10万倍的模型才能达到那种性能水平。这些模型在推理方面很出色,但当时它们没有GPT模型的所有功能,比如不能搜索网络、处理文件上传等,它们只是很擅长推理。所以我们给它们起了新名字,形成了不同的系列,因为它们的功能集不同。有时候你确实想用这个,有时候想用那个,我认为这是正确的决定,尽管有点混乱,但这帮助我们更快地将这些技术推向世界。
现在,人们用这些模型做了很多了不起的事情,无论是编程、前沿科学还是其他领域。我们在大多数情况下都优先考虑速度,力求尽快把新工具交到人们手中,让他们能更快地做更多酷的事情。但我们确实分开了模型系列,现在,随着我们对这些推理模型越来越熟悉,我们正在教它们使用GPT系列的所有工具,比如处理文件上传、搜索网络,甚至在推理过程中使用Python编程,这很酷,它们可以写代码来帮助自己更好地理解问题。所以,o系列和GPT系列开始拥有相同的能力,这给了我们一个机会把它们重新整合在一起,这就是我们计划用GPT-5做的事情。我们正在努力简化模型系列,尽管我们在命名方面真的很糟糕。
主持人:你有GPT-5的发布时间表吗?我知道这个问题很难回答,但我还是得问。
Kevin Weil:嗯,很快,我们正在谈论它,所以时间上有些不确定性,因为我们确实想在整合时简化模型,这意味着用户习惯的所有工具和功能都需要运行得非常好。我们正在教推理模型很多新技能,这是研究性质的工作,所以有些事情存在不确定性。我不会给你具体时间,但会很快,我们很认真地对待这件事,团队正在为此努力工作。
二、AI领域的竞争与创新
主持人:Kevin,我不是工程师,我是你们产品的用户,我很喜欢它们。随着时间推移,我们看到竞争对手崛起,有人说AI模型可能会被商品化,所以实际的产品和应用场景变得更加重要。你们肯定也注意到了,如果OpenAI领先,其他公司也会推出类似产品。作为产品负责人,你们在制作产品时会关注竞争对手的动向吗?你们如何思考如何继续保持这种先发优势和领先地位?
Kevin Weil:这是个好问题。我稍微不同意你问题的框架。我其实不认为模型正在被商品化,它们发展得很快,进步速度惊人。事实上,模型智能的增长速度是不可思议的。Sam几周前提到,如果你把智能水平保持不变,智能的成本每年下降10倍。想想摩尔定律,过去60年它定义了我们的科技时代,每18个月芯片上的晶体管数量翻倍,性能提高一倍。而在AI领域,智能成本每年下降10倍,这条曲线陡峭得多。当然,智能水平并不是保持不变,而是在大幅提升的同时,成本还在下降。这是一系列令人难以置信的发展趋势。我不认为这些模型被商品化了,它们都在快速进步。因为我们处于如此陡峭的发展轨道上,其他人确实能够很快赶上领先者,但这并不意味着领先不重要。我认为即使是3到6个月的领先也非常关键,因为这意味着你首先获得新能力,可以首先推出利用这些能力的新产品。由于这些能力是全新的,这些产品以前从未存在过,比如Deep Research。你是第一个这样做的,其他人都在追随,我认为这是一个很有价值的位置。我们会尽最大努力保持领先优势。其他实验室在某些方面领先,这很好,但我们非常有竞争力,我们会关注其他人的工作。我们希望引领潮流,我们的使命是确保人工通用智能(AGI)造福全人类,我们通过把AI交到每个人手中来实现这一点,无论是通过ChatGPT等自家产品,还是通过API让300万开发者在各种工具、公司和产品中嵌入AI。我们会尽一切可能把AI带给尽可能多的人。
主持人:我有个问题,这更像是我的个人观察。坦白说,我差点要取消ChatGPT的订阅,转而用Claude一段时间。是的,就在不久前。但后来Deep Research发布了,我当时是普通Plus计划的用户,听说Deep Research是Pro计划的一部分。我想,可能不会那么好,但我在Twitter上看到很多关于它的推文。有人说"这是现象级的",我看到越来越多的好评,于是我想,算了,我去升级到Pro计划吧。老实说,我很久没有像使用Deep Research那样有"哇"的惊叹时刻了。Deep Research太棒了,你知道Perplexity有深度研究功能,Grok也有,但没有什么能比得上你们的Deep Research。我想知道,这其中有多少是底层模型的功劳,有多少是你们在产品上的工作?因为Deep Research真的很棒,我每天都用它。即使是最简单的查询,我也会用它,因为它会查遍Reddit和一大堆博客帖子,收集所有信息,而且几乎不出现幻觉。在我看来,它感觉像是真正的人工通用智能,因为以前的AI给我的感觉是输出内容很通用,但Deep Research充满了洞察力。比如,如果你问它制作一个顶级游戏平均需要多少人,早期版本的AI会很含糊,但现在它会给出具体例子,说这个游戏用了这么多人,那个游戏用了那么多人,非常有用。这可能是我对Deep Research最长的赞美了。
Kevin Weil:哈哈,你可以继续夸Deep Research,你做得很好。我认为Deep Research是自ChatGPT以来我们推出的最佳产品。它太神奇了,内部我们称之为"感受AGI"的时刻,会让你起鸡皮疙瘩。从理性角度,你看到AI和模型智能的趋势在不断增长,但有时候很难真正理解当人工通用智能无处不在时会是什么感觉。但偶尔你会得到一丝暗示,Deep Research就是其中之一。它让我能做一些我自己无法做到的事情,比如我是个物理爱好者,我想了解μ子对撞机,我让它为我做了一个大报告,20分钟后它给了我一个15页的μ子对撞机报告,这是我自己做不到的。还有为我儿子做一些医学研究,我没能力做那种专业研究,它为我做了,给了我很多安心。它不只是节省一点时间,而是从根本上为我做了我自己无法完成的事情,这让我大开眼界。回到你的问题,我认为功劳要归于研究团队,他们做得难以置信。但这也是一个例子,研究团队、产品团队、工程团队和设计团队从一开始就紧密合作,确保我们为用户解决的问题与我们训练模型的方式相匹配。当我们训练模型提升某些技能时,这些技能直接与我们试图创建的产品相关。这真的是将这些团队结合在一起产生的魔力。我认为,如果我们是分开运作的研究团队和产品团队,我们无法创造出这样的产品。
主持人:关于Deep Research,我想再问一个问题。最近我试用了GPT-4.5,它有种很明显的大模型感觉,我不知道怎么准确解释,但当我使用较小的模型,比如GPT-3 Mini,我能感觉到它太字面化了,就是一种直觉上的感受。而GPT-4.5写得非常好,它能捕捉到我话语中的细微差别和各种特殊情况。据我所知,GPT-4.5没有推理能力,这只是一个更大的预训练模型。你认为,将这种新的预训练水平与推理能力结合起来,我们会看到前所未有的新东西吗?你期待能力的大幅提升吗,还是如果模型已经足够大,推理就不那么重要了?
Kevin Weil:不,我认为推理绝对重要,你可以在测试基准中看到这一点。如果你看一些更学术、更科学的测试基准,比如GP QA、Frontier Math或ARC-GI,GPT-4.5无法与o1相提并论,更不用说即将推出的o3了。但正如你所说,还有一些更软性的评估,更模糊、更人性化的东西,GPT-4.5在这些方面非常出色,这很难量化,但在人类反馈和A/B测试中,你可以看到人们对GPT-4.5的偏好远超其他模型。我认为这表明,今天我们知道有两种方法可以提升模型的智能:你可以做越来越大的预训练,或者在上面做越来越多的强化学习(RL)来教它推理。最终的答案不是二选一,而是两者都要继续发展。更大的预训练模型能获得软技能,更好的世界知识,更有趣的对话,它们感觉更人性化或更真实。
你问我为什么,我认为在更大的模型中,你可以包含更多的细微差别。人类世界充满了维度、细微差别和多样性,当你将一个大模型提炼成较小的模型时,比如将GPT-4提炼成GPT-4 Mini,取决于你如何提炼,你可以保留你在意的特定方面的技能。如果你想构建一个非常好的小型编程模型,你完全可以做到,你可以提炼GPT-4或o1,得到一个非常好的编程模型,性能测试可能不完全相同,但非常接近,而且模型更小。但如果你试图与它聊天,它就不是一个很有趣的对话伙伴,它在某种程度上失去了个性。如果它是一个专门用于编程的模型,你可能不在乎这点,因为那不是你使用它的目的。小模型在很多方面都很出色,但当维度减少时,你会失去细微差别和多样性,而这些恰恰是使得与大模型交谈非常愉快的因素。我认为反过来也是如此,当扩大模型规模时,增加的维度有更多空间来包含更多细微差别。这听起来有点感性,但我觉得背后有科学支持,这在我们看到的一切中都是真实的。GPT-4.5在处理需要人性化理解的问题方面是迄今为止最好的,你必须亲自尝试才能体会,然后你会说:"哦,我完全明白了。"
三、AI如何改变编程与创意工作
主持人:是的,它是一个更好的写手,GPT-4.5的写作感觉很人性化。几乎就像两三年前,我会认为推理能力是写得更好的关键,逻辑上你认为这个发生了,然后那个发生了,这应该帮助你写得更好。但实际上,这种细微差别才是导致写作技能提高的原因,这出乎我的意料。所以我在脑海中做了一个修正。 但我有个问题,我想问关于特定技能的问题。我们先谈编程。三年前,如果你说编程将被自动化,没人会相信你,他们会说GPT-2连基本的编程都做不好。到了GPT-3,它能输出一些简单代码,比如做一个按钮。两年前,当GPT-4出现时,它开始每天被使用,现在它已经非常出色,特别是在竞争性编程方面,而且在构建前端或后端基础设施方面也越来越好。我几周前和Anthropic的人交谈,我问他们Anthropic是否有编程99%自动化的时间表,我指的是前端和后端的实际功能代码,他们说2027年。你有时间表吗?你对编程的未来有什么看法?因为你每天都在写代码,与研究团队合作,构建产品,你对此有什么预测或观点吗?
Kevin Weil:按照我们现在的发展速度,我会感到惊讶如果要等到2027年,我认为会更早。Anthropic说2027年,我们会说2026年。我看一下,当我们推出GPT-4时,它是一个非常好的编程模型,GitHub Copilot等工具被广泛使用,但与o1 preview相比,o1在编程方面要好得多,因为推理能力在编写代码时很重要。无论是解决难题、填字游戏、数独还是编写代码,你都需要一定程度的推理能力,能够将问题分解成更小的部分,形成假设,验证或反驳这些假设,这就是推理的作用。o1 preview大约相当于世界上排名第100万的竞争性程序员,这听起来不太好,但世界上有3000万到4000万程序员,所以它在前2-3%。o1正式发布时,大约相当于世界上排名第1000名的工程师。即将推出的o3,根据相同的测试标准,相当于世界上排名第175名的竞争性编程者。随着我们开始训练后续模型,它们的表现更好。
所以我认为,今年AI在竞争性编程标准上将永远超越人类,就像70年前计算机在乘法上超越人类,15年前AI在国际象棋上超越人类一样。今年,AI将在编程上永远超越人类,而且没有回头路。我们对此投入了很多关注,Anthropic、Google也在投入大量精力,所以这将发展得非常快。我认为世界会因此变得不同,而且我认为会变得更好。想象一下,如果你不需要成为工程师就能创建软件,软件可以让你创造任何你想要的东西,这将对世界产生民主化的影响。新冠疫情期间,我和一些人交流,他们试图为当地城市创建一个网站来跟踪疫情数据,但没有工程师可用,他们自己也没有这方面的技能,结果他们无法做到。而今天,这对任何顶级AI模型来说都不是问题,更不用说未来这些模型能够生成任意数量的优秀软件时。我对这个未来感到兴奋,它很快就会到来。
主持人:Kevin,作为一个内容创作者,关于AI生成内容将如何大量涌现的讨论正在进行。Varun的Instagram基本上是假的,95%的视频都不是他,而是有人点击几个按钮让它看起来像是他。真实性正在迅速减弱,你们在OpenAI是否关注这个问题?你们是否积极思考当一切都可以自动生成时,互联网会发生什么?
Kevin Weil:我给你我的个人观点。我认为对于大多数人类创作,人们重视一种"工作证明"。如果创建大量基于AI的内容变得非常容易,就像现在制作图像一样,人们会更加重视那些花了很多时间和精力创作的东西,而不是那些可以在五秒内制作的东西。拿Sora来说,你现在不能对Sora说"给我做一部电影",它做不到。但如果你给它非常深思熟虑、详细的提示,你可以让它创造出惊人的东西。我们内部有一个创作者,他以前在行业内工作过,他用Sora做的事情让我难以置信,远远超出了我的想象能力。我和一位导演交谈过,他正在考虑使用Sora。他说,以前他做科幻片,比如有一个场景是太空中的飞机飞向一个行星,然后需要切换到飞船在行星表面飞行的场景。有很多种方式可以做这个切换。今天,他会去特效工作室,花10万美元,让他们用一个月时间做两种版本的切换场景,然后他从中选择一个,因为他只有这两个选择。
而用Sora,他可以在一个下午制作40个不同的版本,探索各种不同的表现方式,让他的创造力自由发挥,与AI合作做更多的尝试。最后,他可能还是会去同一家特效工作室制作他最喜欢的那一个,但他是带着50个想法中最好的一个去的,得到的结果比以前好得多,因为他与AI合作进行了更充分的创意探索。我认为,在这个世界上,创作伟大的作品仍然需要大量的工作和专业知识。创作伟大作品所需的努力和专业知识的标准可能保持不变,只是通过AI,输出可以更好,更容易被世界接受,更快完成。如果你能立即看到结果,你就不会被别人拖慢速度。你花同样的心力,但不用等待VFX工作室可能需要一个月才能完成的工作,而是立即得到反馈。我和行业内另一个人交谈过,他们说创意工作或编程的未来将转向管理,因为我们现在用AI拥有的能力,对于有资本的人来说一直是可用的,那就是雇佣人。我现在写的代码比一年前少得多,因为我可以让一群人去尝试各种实验,他们可能需要一周时间来完成,而现在他们也在使用AI。
主持人:你是否认为,如果你是一个创意人士,无论是编程者还是撰写内容或制作广告脚本的人,你会如何适应这个新世界?因为在印度和世界各地,有很多人重视智力,认为编程是智力的象征,而现在它正在被商品化。如果你是一个刚开始职业生涯的工程师,你会如何应对即将到来的地位冲击?因为你在Twitter上已经看到了一些迹象,每天都有关于这个话题的讨论,有人在否认,有人在悲伤,各种反应都有。也有人说没什么会发生,因为创造结果所需的努力是相同的,我同意这一点。但如果你能接触到AI工具,现在你就在与那么多其他会写英语的人竞争,他们可能不像你那样了解底层技术,但现在也在市场上竞争同样的工作或职位。你如何看待这种影响?
Kevin Weil:我认为,在一个AI模型不受智能限制而是受教学限制的世界里,专家和经验仍然很重要。Jeff Dean是一个比我更好的工程师,我敢打赌Jeff Dean加上AI比我加上AI做得更好。专业知识和经验,理解要解决什么问题,关注哪些方面,如何利用资源,这些仍然很重要。我不认为一切都会完全平等,专业知识不再重要。然后,你开始思考什么才是真正重要的,如果你能创造任何东西,那么知道要创造什么就变得非常关键。谁能感觉到最重要的问题是什么,以及如何解决它们,如果更多的人能够解决这些问题,世界会变得更好,因为更多的问题会得到解决,社会会更快地前进,我对此感到兴奋。
四、AI将如何塑造工作与教育
主持人:听起来,AI可能会创造新的工作类别,但这似乎与"现有工作将继续存在但AI会成为其中一部分"这一观点有些矛盾。你能预见会出现什么样的新工作吗?在你构建产品的过程中,有没有什么具体的想法,你认为在未来几年内肯定会成为现实?
Kevin Weil:很难说,我不确定我有一个能让你满意的答案。但我认为几乎所有的工作都会被AI补充。无论你是在日常工作中使用AI来增强自己的能力,还是像Varun说的那样,人们将越来越多地成为AI员工的管理者,这些AI员工会为他们完成很多基础工作。也许我们会把"所以这意味着什么"留给人类,AI做很多"是什么"的工作,然后人类仍然对"这意味着什么"负责,就像你作为团队管理者一样。但我不敢确定,我认为很多事情会在未来几年内发生变化。我唯一确信的是,人们天生希望成为比自己更大的事物的一部分。我不相信一个我们都获得普遍基本收入,然后躺在沙发上做艺术的世界。我认为人们想要创造,他们想要帮助他人,他们想要让世界变得更好。AI会改变很多事情,它会帮助我们以现在无法做到的方式实现目标,但我认为这种基本愿望是人类的本性。所以我不认为会有一个AI为我们做所有工作的世界,而我们都放松下来什么都不做。我认为我们仍然会努力工作,仍然会努力让世界变得更好,只是我们会有不同的工具来做这些事情。
主持人:也许不是这个话题,但我在想,当你们构建产品时,你们肯定有很多优先事项,你们在开发自己的产品,但在工作过程中,你们会想,"啊,那是一个创业点子"。你们在创造智能,然后想,"那应该成为一家公司"。当然,你们不会花时间去建立那个公司,因为你们有其他优先事项。但你脑子里有没有几个想法,觉得有人应该利用你们正在构建的技术来做些什么?你们在为创业公司挖掘想法吗?
Kevin Weil:是的,你在寻找播客之后的项目。嗯,我会给你一个一般性的想法和一个具体的想法。一般性的想法是,我之前说过,这些模型不受智能限制,而是受教学限制,它们可以学习任何东西,关键是你有什么来教它们。所以我认为,利用私有数据可以构建很多大公司。模型是在互联网和公共数据上训练的,但世界上大部分数据不是公共数据,而是锁在企业、机构、政府等围墙后的私有数据。你可以用这些数据让模型变得非常强大。你已经在法律等领域看到了这样的例子,他们利用私有数据来增强模型,使其在特定功能上变得出色,能够深入了解法律工作流程。我认为你可以在很多不同的领域这样做。
具体的想法是,这对全世界都非常重要,特别是对印度。我真的希望每个孩子都能有一个个性化的导师。我不知道为什么今天还没有实现。我的孩子没有这样的导师,你知道有谁有吗?这感觉是最有价值的事情之一,你可以做一些有意义的事情来加速世界的进步和提高生活质量。因为我见过的每一项研究都表明,有个性化导师的孩子比只有普通教育的孩子表现高出几个标准差。显然,世界上有很多孩子甚至没有我们认为的基本教育,但他们可能有手机,而ChatGPT是免费的。我只是想看到一个世界,每个孩子都有一个个性化的导师,可以教他们任何他们想知道的东西,以他们想要的速度推动他们,让他们按照自己天生的智力水平成长。世界会变得更好,AI今天就可以做到这一点。这不是要等待四年后的技术突破,AI已经准备好了。我想看到有人用一个惊人的AI导师席卷全球。我认为在OpenAI,我们会尽一切努力支持有人大规模地做这件事。这是我们能够改善世界的最直接方式之一。
主持人:语音模式有普及吗?因为我以为当我们有像电影《她》那样的技术时,我们会经常使用语音模式,一直和AI交谈,但我发现自己更多的是在和AI发短信,我不怎么使用语音模式,这很奇怪,因为我一直以为会是相反的情况。你有什么看法吗?因为你在OpenAI负责产品,你知道为什么它没有普及,或者可能我的理解有误?
Kevin Weil:我认为它会普及的,我们有很多用户一直在使用它。有很多重度用户,比如我知道有人下班走路回家时,无论是走到车边还是公交车站,他们会一直和ChatGPT交谈,回顾他们的一天,讨论会议,谈论待办事项,最后从ChatGPT那里得到一组待办事项,总结了他们的一天。所以有很多很酷的语音应用场景。我认为它可以比现在好得多。现在,如果你停止说话,语音模式会立即接入,因为它认为你说完了。人类不会这样做,他们会根据各种提示来判断,而AI目前还不会。你开始说话,然后它停下来,然后又开始,我们人类学会了稍微打断对方,然后根据各种暗示决定谁继续说。我们在播客中一直在这样做。 所以有这些细微的暗示会让对话感觉非常真实。我们非常重视这一点,我认为你会很快看到很多改进。语音模式对我来说很棒,但还没有达到它应该有的水平,我非常有信心我们会达到那个水平,这将开启更多可能性。你希望能够以与人类互动的每一种方式与ChatGPT交流,有时是视频,有时是语音,有时是打字,你需要能够做到所有这些。
主持人:Kevin,有时候你看着你正在做的工作,你会想,也许这个问题的答案是一个实体产品。你有想过这方面的事情吗?
Kevin Weil:我们开始关注机器人技术,具体形式还有待观察。可能是我们自己做一个大型机器人项目,或者我们只需要积累足够的真实世界经验来构建优秀的视觉模型和现实世界理解模型。无论如何,我们知道机器人技术将是一个重要领域,我们希望为许多其他公司在机器人领域做出卓越成就提供技术支持。 对我来说,首先是让数字世界运作正确,然后在数字世界中拥有人工通用智能帮助我们做各种事情之后,下一个明显的方向就是机器人技术和对现实世界的影响。所以,如果你想成为我们希望成为的那种公司,你必须能够在这两个领域都发挥作用。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
参考资料:https://www.youtube.com/watch?v=SnSoMh9m5hc&t=88s&ab_channel=Overpowered
来源:官方媒体/网络新闻
排版:Atlas
编辑:深思
主编: 图灵
热门跟贴