始智AI wisemodel.cn开源社区
始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。
2025年, 大模型竞争激烈且重心转向推理能力发展。中国团队A-M-team在Hugging Face开源了32B推理模型AM-Thinking-v1。该 团队依托开源底座,深度优化训练流程,在不依赖私有数据与大规模计算资源的情况下,成功打造开放社区32B规模推理性能领先的模型。 模型 现已上线始智AI-wisemodel开源社区,欢迎使用。
模型地址
https://wisemodel.cn/models/a-m-team/AM-Thinking-v1/intro
01.
成绩亮眼:突破32B模型参数
在主流评测里,32B参数量的AM-Thinking-v1展现出强大实力。数学推理任务采用AIME系列题目测试,模型得分85.3;在代码生成的LiveCodeBench评测中,获得70.3分。相比之下,671B MoE架构的DeepSeek-R1在这两项评测得分低于AM-Thinking-v1,并且成绩接近甚至与Qwen3-235B-A22B、Seed1.5-Thinking等超大规模MoE模型相当 。
权威评测下的卓越表现:AIME系列题目来自美国数学邀请赛,是衡量模型逻辑思维能力的金标准;LiveCodeBench强调代码可执行性和稳健性,数据污染难度高 。AM-Thinking-v1在这些严苛考验中脱颖而出,展现“小体积,大推理”的极限范式。
AM-Thinking-v1 模型测试得分表
AIME2024 不同模型尺寸效果对比;x 轴为模型尺寸,y 轴为分数
LiveCodeBench 不同模型尺寸效果对比;x 轴为模型尺寸,y 轴为分数
实际任务中的强大能力:在解决“旋转三角形中红球反弹”问题时,AM-Thinking-v1展现出极强的多步逻辑理解,能给出完整运动轨迹模拟和小球碰撞判断;在逻辑推理任务中,保持稳定思考过程;在长文本写作能力测试中,也展现出初步的表达逻辑和意象捕捉组织能力。
“旋转三角形中红球反弹”问题
逻辑推理任务
长文本写作能力
02.
训练方案:挖掘32B模型潜力
A-M-team团队设计了一整套后训练方案,旨在用有限计算和开源数据,最大化32B模型的推理能力,包括冷启动式监督微调、通过率引导的数据筛选机制以及双阶段强化学习(Dual-stage RL)。
监督微调(SFT)阶段:采用激进但有效的设置,将学习率拉到8e-5,加大batch size,支持最长32K输入长度。训练样本设计为“先思考再回答”格式,帮助模型养成“先想清楚、再说话”的习惯,且训练中模型在控制长度、避免啰嗦方面有明显进步。
数据处理:完全依靠开源资源,整理出数学、代码、科学推理、指令跟随和通用对话五类核心任务数据。进行大量清洗工作,包括去重、改写问题避免与评测集“撞题”,严格验证数学数据,用DeepSeek-R1和o4-mini交叉比对标准答案。生成的训练样本经PPL算分、检查重复短语和结构完整性等层层筛选,确保数据质量。
强化学习(RL)阶段:选用轻量级GRPO算法,采用“难度感知”策略,先针对模型薄弱题目训练,熟练后加入通用对话和指令跟随任务拓展能力。奖励机制多样,数学和代码类问题用规则验证或跑沙盒程序验证答案;open - ended回答让LLM从有用性、准确性、连贯性三方面打分。在工程上,将推理和训练分开,采用streaming rollout方式,并配备前端负载均衡器动态分配任务,提升训练效率、节省资源 。
不过,AM-Thinking-v1目前还存在局限性,不支持函数调用、多模态输入,对低资源语言的能力也有待验证。
03.
探索意义:32B推理模型的价值
当前大模型发展主流路线追求大参数规模、复杂架构、庞大训练数据和昂贵训练资源,但存在成本高、部署难、推理延迟高、适配门槛大等问题。A-M-team选择专注32B“中尺度模型”参数区间,有明确考量:
足够强大:相比7B或13B模型,32B能支持复杂数学推理和代码生成,具备执行严肃reasoning任务基础。
成本可控:与巨型模型相比,32B模型训练与推理资源需求显著更低,适合企业或研究机构内部复现、部署和迭代。
部署友好:可在单节点或小规模集群上运行,应用于更多落地场景。
MoE替代探索:验证不使用专家模型,仅靠稠密结构和扎实后训练设计,能否达到甚至超越MoE模型表现。
AM-Thinking-v1的诞生与出色表现,印证了这一探索方向的潜力,它回答了“大模型能力的上限,能不能用更小的体量实现”这一关键问题,也为开源LLM社区提供了新的思路,即通过细致训练设计,无需堆参数和私有数据,也能打造出足够聪明的模型。
04.
在线体验:速验32B模型能力
W isemodel社区支持直接通过模型镜像创建在线体验或者API服务,在 AM-Thinking-v1 模型详情 页 点击“在线部署-部署在线体验”或者 “在线部署-部署API服务”按钮。
然后选择硬件配置,以及根据自己的需求选择计费方式。
提交订单之后,应用已经进入启动中的状态,正常情况下大概等待1分钟左右就正常运营,进行在线体验或者使用API服务了。
在线体验
API服务
----- END -----
wisemodel相关:
系统升级:
大赛报名:
系列模型:
关于wisemodel更多
1
欢迎持续关注和支持
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。
2
欢迎加盟wisemodel开源社区
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn
3
欢迎投稿优质内容
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。
4
关于wisemodel开源社区
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。
向上滑动查看
热门跟贴