本期为TechBeat人工智能社区666线上Talk。

北京时间3月6日(周四)20:00,卡内基梅隆大学博士后研究员岳翔& 清华大学本科生童雨轩的Talk将准时在TechBeat人工智能社区开播!

他们与大家分享的主题是:“解密大模型长链推理”,届时他们将介绍团队在理解和提升大语言模型推理能力方面的最新研究进展。

Talk·信息

主题:解密大模型长链推理

嘉宾:卡内基梅隆大学 · 博士后研究员 - 岳翔 & 清华大学 · 本科生 - 童雨轩

时间:北京时间3月6日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

大语言模型(LLMs)近年来取得了显著进展,但在解决复杂任务的推理能力方面仍面临诸多挑战。在本次报告中,我们将介绍我们在理解和提升大语言模型推理能力方面的最新研究进展。首先,我们将探讨我们对长链式思维(Chain-of-Thought, CoT)推理复杂性的深入研究,并分析监督微调(Supervised Fine-Tuning, SFT)和强化学习(Reinforcement Learning, RL)中影响LLM推理能力的关键因素。我们还将讨论LLM推理在未来仍需面对的挑战。

Talk大纲

1. 影响大模型长链式思维复杂推理的因素到底有哪些?

2. 强化学习当中哪些设置起到了关键作用?

3. 仅依靠监督微调是否能够起到提升推理的效果?

4. 未来的大模型复杂推理又面临什么样的挑战?

Talk·预习资料

论文链接: https://arxiv.org/abs/2502.03373

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

岳翔‍‍‍‍‍‍‍‍‍‍‍

卡内基梅隆大学 · 博士后研究员‍‍‍

岳翔是卡内基梅隆大学(CMU)的博士后研究员。他于2023年在俄亥俄州立大学 (OSU)获得博士学位。其研究重点是理解和增强大语言模型(LLMs)的推理能力,并在该领域做出了诸如 MMMU和 MAmmoTH 等贡献。他的研究成果曾获得CVPR 2024 和 ACL 2023 的最佳论文提名。

个人主页: https://www.techbeat.net/grzytrkj?id=43981‍‍‍‍

童雨轩

清华大学 · 本科生

大四本科生,曾于清华大学知识工程实验室(THUKEG),香港科技大学自然语言处理实验室(HKUST-NLP),卡耐基梅隆大学语言技术研究所(CMU-LTI)等机构实习,致力于构建能够处理长上下文复杂推理的人工智能系统。曾于 NeurIPS 发表论文 2 篇,其中第一作者 1 篇,谷歌学术引用量达 440。

个人主页: https://www.techbeat.net/grzytrkj?id=43991

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk