打开网易新闻 查看精彩图片

GPT1、GPT2 和 Whisper 的第一作者,也是 DallE、GPT3、PPO、缩放定律和 RLHF 的合著者Alec Radford从OpenAI离职

Alec Radford,于周四向同事宣布,他将离职并独立从事研究。据一位看到 Radford 离职消息的人透露,他计划与 OpenAI 以及其他人工智能开发者展开合作

提起人工智能领域的大牛,Alec Radford 无疑是绕不开的名字。他不仅是 OpenAI 的核心人物,更是改变自然语言处理(NLP)游戏规则的关键推手。作为 GPT 系列模型的主创之一,他推动了从语言到图像再到多模态 AI 技术的全面革新。这位年仅 35 岁的 AI 天才究竟有着怎样的传奇经历?我们一起来扒一扒

2016 年,Radford 加入刚刚成立的 OpenAI,并迅速成为该组织的核心研究员之一。在 OpenAI,他开启了一段传奇旅程:

1. GPT:重塑自然语言处理

Radford 是 GPT(Generative Pre-trained Transformer)初代论文的第一作者,首次提出基于 Transformer 架构的预训练语言模型。他的研究表明,通过在海量无标签文本上进行预训练,再通过少量任务数据进行微调,模型可以在多个任务上展现出强大的泛化能力。这一突破直接引领了 NLP 从任务专属模型向通用模型的转变

随后的 GPT-2 和 GPT-3 更是将这一理念推向极致。通过大规模参数和数据的加持,这些模型不仅在生成文本的连贯性和上下文理解上达到了新的高度,还实现了少样本学习(Few-Shot Learning)的能力,彻底改变了行业对大规模预训练模型的认知

2. DALL-E 和 CLIP:文本与视觉的融合

在语言之外,Radford 还深入探索了多模态领域。他主导了 DALL-E 和 CLIP 的开发:

• DALL-E 是一款可以将文本描述转化为高质量图像的生成模型。这一技术展示了 Transformer 架构在跨模态任务中的潜力,进一步拉近了自然语言和视觉处理的距离

• CLIP 则通过对比学习(Contrastive Learning)方法,打破了传统分类模型的限制,使得图像和文本可以在共享空间中表达。这不仅提升了模型的多样性和适应性,也为下游任务提供了前所未有的灵活性

3. Whisper:让机器“听懂”世界

除了语言和图像,Radford 还涉足了语音领域。他开发的 Whisper 是一款通用语音识别模型,不仅能听懂多语言内容,还能处理各种口音和语速的语音输入,被认为是目前最强大的语音识别工具之一

Alec Radford谷歌学术他引接近20万

打开网易新闻 查看精彩图片

Alec Radford cv

打开网易新闻 查看精彩图片

Alec Radford :GPT-1 一作

打开网易新闻 查看精彩图片

Alec Radford :GPT-2 一作

打开网易新闻 查看精彩图片

Alec Radford :GPT-3 合著

打开网易新闻 查看精彩图片

Alec Radford :Whisper一作

打开网易新闻 查看精彩图片

Alec Radford :Scaling Laws合著

打开网易新闻 查看精彩图片

Alec Radford :DallE合著

打开网易新闻 查看精彩图片

Alec Radford :RLHF合著

打开网易新闻 查看精彩图片

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞