5月9日,蚂蚁百灵今日正式发布万亿级旗舰思考模型 Ring-2.6-1T,专为复杂真实任务场景设计。模型创新引入可调节 Reasoning Effort 机制,支持 high 与 xhigh 两档推理强度,帮助开发者在效果、速度与成本间灵活权衡。
在多项权威评测中,Ring-2.6-1T 表现亮眼:在真实任务执行类评测中,PinchBench 得分 87.60,显著高于 GPT-5.4 xHigh、Gemini-3.1-Pro high 与 Claude-Opus-4.7 xhigh;在高难推理任务上,ARC-AGI-V2 得分 77.78,与 Gemini-3.1-Pro high 和 Claude-Opus-4.7 xhigh处于同一水位。
Ring-2.6-1T 希望解决的不只是“模型是否足够聪明”,更是“模型能否以合理推理成本,在真实复杂工作流中稳定、高效地完成任务”。
热门跟贴