7月22日凌晨,阿里巴巴旗下大模型千问(Qwen)在 Hugging Face 上发布 Qwen3-235B-A22B-Instruct-2507-FP8。这一更新版本被视为 Qwen3-235B-A22B-FP8的“非思考模式”升级版。
根据官方介绍,新版本模型在指令遵循、逻辑推理、文本理解、数学、科学、编程与工具使用等通用能力上均实现大幅提升。
在多个公开基准测评中,Qwen3-235B-A22B-Instruct-2507-FP8超越了包括 Kimi-K2、DeepSeek-V3在内的顶级开源模型,并在部分任务上超过了 Claude-Opus4-Non-thinking 等闭源强模型。测评项目涵盖知识(GQPA)、数学(AIME25)、编程(LiveCodeBench)、偏好对齐(Arena-Hard)及 Agent 能力(BFCL)等。
此外,据介绍,该模型还在以下几个方面取得突破:一是对多语言长尾知识的覆盖能力显著增强;二是在主观与开放性任务中,生成内容更符合用户偏好;三是上下文长度支持扩展至256K,进一步提升了长文本处理能力。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
热门跟贴