推理大模型新范式:从o1到DeepSeek-R1再到QwQ-32B(2)-强化学习的方法

X
推理大模型新范式:从o1到DeepSeek-R1再到QwQ-32B(2)-强化学习的方法
卢菁老师
卢菁老师
北京
0
打开网易新闻 体验效果更佳