阿里千问推出升级版Qwen3模型，性能超越Kimi-K2与DeepSeek-V3

网易科技报道

2025-07-22 10:08 ·北京 ·网易科技官方网易号

7月22日凌晨，阿里巴巴旗下大模型千问（Qwen）在 Hugging Face 上发布 Qwen3-235B-A22B-Instruct-2507-FP8。这一更新版本被视为 Qwen3-235B-A22B-FP8的“非思考模式”升级版。

根据官方介绍，新版本模型在指令遵循、逻辑推理、文本理解、数学、科学、编程与工具使用等通用能力上均实现大幅提升。

在多个公开基准测评中，Qwen3-235B-A22B-Instruct-2507-FP8超越了包括 Kimi-K2、DeepSeek-V3在内的顶级开源模型，并在部分任务上超过了 Claude-Opus4-Non-thinking 等闭源强模型。测评项目涵盖知识（GQPA）、数学（AIME25）、编程（LiveCodeBench）、偏好对齐（Arena-Hard）及 Agent 能力（BFCL）等。

此外，据介绍，该模型还在以下几个方面取得突破：一是对多语言长尾知识的覆盖能力显著增强；二是在主观与开放性任务中，生成内容更符合用户偏好；三是上下文长度支持扩展至256K，进一步提升了长文本处理能力。（袁宁）

本文来自网易科技报道，更多资讯和深度内容，关注我们。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴