2020年,GPT-3的登场重塑了行业对语言模型的认知。它证明了一件事:一个足够庞大的神经网络,可以直接从提示词和示例中学习任务,无需传统的精调。这个想法催生了提示工程、AI助手,以及第一波大语言模型应用。
但GPT-4的感觉完全不同。
GPT-3仍然像一个研究突破:强大、实验性,有时还不可预测。GPT-4则像是真正的AI平台的开端。关注点不再是单纯扩大模型规模去刷榜,话题转向了可靠性、多模态理解、对齐、安全性,以及真实世界的部署。这种转向,在OpenAI发布的GPT-4技术报告里随处可见。
和早期的几篇GPT论文不一样,OpenAI这次没有发布包含详细架构图、参数规模、数据集、训练配置的传统研究论文。他们给出了一份范围更窄的技术报告,重点放在能力展示、评估、安全工作与部署考量上。这个决定本身,就反映出领域已经彻底变了。到了GPT-4面世时,大语言模型不再是实验室里的研究项目,它通过ChatGPT这类产品成了全球数百万人在用的部署系统。关于滥用、幻觉、偏见、网络安全风险和对齐的问题,变得和模型原始性能同等重要。
GPT-4还带来了一个根本性转变:多模态。此前的模型只处理文字,GPT-4扩展了边界,同时接收图像和文本作为输入,让模型能分析截图、图表、文档、视觉笑话以及其他混合信息形式。这一步把大语言模型推向了更通用的AI系统,而非狭窄的文本生成器。回头看,演进的脉络出奇地清晰:GPT-1引入预训练和迁移学习,GPT-2展示零样本多任务学习,GPT-3拿出少样本提示和上下文学习,而GPT-4开启了对齐、多模态AI系统的时代。从很多角度看,GPT-4标志着大语言模型不再被看作研究实验,开始成为真实应用的基础计算界面。
根据OpenAI的说法,报告中刻意隐去了参数量、精确架构、训练算力、数据集组成和硬件配置等信息,部分原因来自竞争格局,也考虑到大规模AI系统日益增长的安全后果。这个差异在历史上很重要——GPT-1、GPT-2和GPT-3的论文都曾公开讨论架构细节,而GPT-4的谨慎本身就是一个行业信号。
热门跟贴