32B模型AM-Thinking-v1超越R1，即刻体验推理|thinking|推理|数学|深度思考模型|算法

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在，欢迎加入共同成长。wisemodel社区上线，价格实惠，灵活方便，支持在线微调训练模型，及和，并。

2025年，大模型竞争激烈且重心转向推理能力发展。中国团队A-M-team在Hugging Face开源了32B推理模型AM-Thinking-v1。该团队依托开源底座，深度优化训练流程，在不依赖私有数据与大规模计算资源的情况下，成功打造开放社区32B规模推理性能领先的模型。模型现已上线始智AI-wisemodel开源社区，欢迎使用。

模型地址

https://wisemodel.cn/models/a-m-team/AM-Thinking-v1/intro

01.

成绩亮眼：突破32B模型参数

在主流评测里，32B参数量的AM-Thinking-v1展现出强大实力。数学推理任务采用AIME系列题目测试，模型得分85.3；在代码生成的LiveCodeBench评测中，获得70.3分。相比之下，671B MoE架构的DeepSeek-R1在这两项评测得分低于AM-Thinking-v1，并且成绩接近甚至与Qwen3-235B-A22B、Seed1.5-Thinking等超大规模MoE模型相当。

权威评测下的卓越表现：AIME系列题目来自美国数学邀请赛，是衡量模型逻辑思维能力的金标准；LiveCodeBench强调代码可执行性和稳健性，数据污染难度高。AM-Thinking-v1在这些严苛考验中脱颖而出，展现“小体积，大推理”的极限范式。

AM-Thinking-v1 模型测试得分表

AIME2024 不同模型尺寸效果对比；x 轴为模型尺寸，y 轴为分数

LiveCodeBench 不同模型尺寸效果对比；x 轴为模型尺寸，y 轴为分数

实际任务中的强大能力：在解决“旋转三角形中红球反弹”问题时，AM-Thinking-v1展现出极强的多步逻辑理解，能给出完整运动轨迹模拟和小球碰撞判断；在逻辑推理任务中，保持稳定思考过程；在长文本写作能力测试中，也展现出初步的表达逻辑和意象捕捉组织能力。

“旋转三角形中红球反弹”问题

逻辑推理任务

长文本写作能力

02.

训练方案：挖掘32B模型潜力

A-M-team团队设计了一整套后训练方案，旨在用有限计算和开源数据，最大化32B模型的推理能力，包括冷启动式监督微调、通过率引导的数据筛选机制以及双阶段强化学习（Dual-stage RL）。

监督微调（SFT）阶段：采用激进但有效的设置，将学习率拉到8e-5，加大batch size，支持最长32K输入长度。训练样本设计为“先思考再回答”格式，帮助模型养成“先想清楚、再说话”的习惯，且训练中模型在控制长度、避免啰嗦方面有明显进步。

数据处理：完全依靠开源资源，整理出数学、代码、科学推理、指令跟随和通用对话五类核心任务数据。进行大量清洗工作，包括去重、改写问题避免与评测集“撞题”，严格验证数学数据，用DeepSeek-R1和o4-mini交叉比对标准答案。生成的训练样本经PPL算分、检查重复短语和结构完整性等层层筛选，确保数据质量。

强化学习（RL）阶段：选用轻量级GRPO算法，采用“难度感知”策略，先针对模型薄弱题目训练，熟练后加入通用对话和指令跟随任务拓展能力。奖励机制多样，数学和代码类问题用规则验证或跑沙盒程序验证答案；open - ended回答让LLM从有用性、准确性、连贯性三方面打分。在工程上，将推理和训练分开，采用streaming rollout方式，并配备前端负载均衡器动态分配任务，提升训练效率、节省资源。

不过，AM-Thinking-v1目前还存在局限性，不支持函数调用、多模态输入，对低资源语言的能力也有待验证。

03.

探索意义：32B推理模型的价值

当前大模型发展主流路线追求大参数规模、复杂架构、庞大训练数据和昂贵训练资源，但存在成本高、部署难、推理延迟高、适配门槛大等问题。A-M-team选择专注32B“中尺度模型”参数区间，有明确考量：

足够强大：相比7B或13B模型，32B能支持复杂数学推理和代码生成，具备执行严肃reasoning任务基础。
成本可控：与巨型模型相比，32B模型训练与推理资源需求显著更低，适合企业或研究机构内部复现、部署和迭代。
部署友好：可在单节点或小规模集群上运行，应用于更多落地场景。
MoE替代探索：验证不使用专家模型，仅靠稠密结构和扎实后训练设计，能否达到甚至超越MoE模型表现。

AM-Thinking-v1的诞生与出色表现，印证了这一探索方向的潜力，它回答了“大模型能力的上限，能不能用更小的体量实现”这一关键问题，也为开源LLM社区提供了新的思路，即通过细致训练设计，无需堆参数和私有数据，也能打造出足够聪明的模型。

04.

在线体验：速验32B模型能力

W isemodel社区支持直接通过模型镜像创建在线体验或者API服务，在 AM-Thinking-v1 模型详情页点击“在线部署-部署在线体验”或者 “在线部署-部署API服务”按钮。

然后选择硬件配置，以及根据自己的需求选择计费方式。

提交订单之后，应用已经进入启动中的状态，正常情况下大概等待1分钟左右就正常运营，进行在线体验或者使用API服务了。

在线体验

API服务

----- END -----

wisemodel相关：

系统升级：

大赛报名：

系列模型：

关于wisemodel更多

欢迎持续关注和支持

开源社区建设需要长期坚持和投入，更需要广大用户的积极参与、贡献和维护，欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果，包括模型、数据集和代码等发布到 wisemodel.cn 社区，共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信，申请加入wisemodel社群，持续关注wisemodel.cn开源社区动态。

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来，逐渐成为影响力日益扩大的中立开放的AI开源社区，为了加快公司发展，我们长期需要技术、运营等人才加盟，技术侧重在AI infra、后端开发，熟悉K8S、模型训练和推理等技术，以及熟悉开发者生态运营的成员，欢迎感兴趣的朋友加盟，可以通过添加wisemodel微信，或者将简历投递到邮箱：liudaoquan@wisemodel.cn

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果，鼓励高校实验室、大企业研究团队、个人等，在wisemodel平台上分享各类优质内容，可以是AI领域最新论文解读、最新开源成果介绍，也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn，也可以扫码添加wisemodel微信。

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立，旨在打造和建设中立开放的AI开源创新社区，将打造成“HuggingFace”之外最活跃的AI开源社区，汇聚主要AI开源模型、数据集和代码等，欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者，以及政府部门、学会协会、联盟、基金会等，还有投资机构、科技媒体等，共同参与建设AI开源创新生态。

向上滑动查看