联手OpenAI，吴恩达推出一门o1推理新课程，还免费

机器之心Pro

2025-01-02 15:13 ·北京

机器之心报道

编辑：小舟

在刚刚过去的 2024 年，OpenAI 推出了 o 系列模型。相比于以往大型语言模型，o 系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。

通过在推理时执行思维链推理，o 系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。那么，具体如何使用 o 系列模型来构建需要复杂推理的应用程序呢？

最近，OpenAI 联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用 o1 进行推理的免费 DeepLearning.AI 课程 ——Reasoning with o1，讲师是 OpenAI 战略解决方案架构主管 Colin Jarvis。

课程地址：https://www.deeplearning.ai/short-courses/reasoning-with-o1

Reasoning with o1课程内容主要包括：

o1 即时工程的基础知识
规划和执行多步骤任务
创建和编辑代码
图像推理
可提高模型性能的 Metaprompting

通过这门课程，学生将：

了解 o1、它的工作原理、性能以及使用它的最佳场景。
了解如何有效地提示 o1 以及何时将任务委派给更具成本效益、更低延迟的模型。
了解 o1 如何在编码和视觉推理任务上表现出色，以及如何应用 Metaprompting 来优化应用程序。

具体来说，在 Reasoning with o1课程中，学生将了解 OpenAI 如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型；了解什么是「思维链」提示，以及 o1 如何自主地利用它来将问题分解为更小的步骤，尝试多种策略，并在回答问题之前仔细思考。

o1 模型特别擅长抽象推理任务。它在规划、编码、分析、特定领域推理（如法律）和 STEM 科目等任务上具有破纪录的性能。Reasoning with o1课程内容涵盖：

学习识别 o1 模型适合哪些任务，以及何时需要使用更小或更快的模型，或将这两者结合起来。
了解使用 o1 进行提示的四个关键原则，并探索性能上的差异。
实现一个多步骤任务，其中 o1 作为协调器创建规划并将其交给 4o-mini 模型按顺序执行规划，平衡智能和成本之间的权衡。
使用 o1 执行编码任务，构建新应用程序、编辑现有代码，并通过在 o1-mini 和 GPT 4o 之间运行编码竞赛来测试性能。
使用 o1 进行图像理解，并了解它如何通过层次推理获得更好的性能，其中它会预先产生延迟和成本，预处理图像并使用丰富的细节对其进行索引，以便稍后用于问答。
学习一种称为 Metaprompting 的技术，以使用 o1 来改进提示。

怎么说？来学习吗？返回

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴