打开网易新闻 查看精彩图片

作者|椒盐玉兔

编辑|椰子

就在高考第一天(6月7日),Qwen2模型正式开源,迅速引起了广泛关注。

打开网易新闻 查看精彩图片

其中参数最大的 Qwen2-72B 不仅在多语言能力、代码生成、数学推理、长文本处理等方面表现出色,而且在指令遵循安全性能上也做出了显著提升。作为国产开源模型的代表,Qwen2-72B 凭借其强大的性能和技术优势,得到了业内外的一致好评。

据官方评测显示,Qwen2-72B 着重与 Llama3-70B 进行了对比测试,并且在各项指标上都一度超过了 Llama3-70B。那么,究竟哪款模型更胜一筹呢?

打开网易新闻 查看精彩图片

数据源自官方 https://qwenlm.github.io/blog/qwen2/

本文将从多语言能力、代码生成、数学推理、长文本处理、自然语言、指令遵循等6个方面进行全面测评。话不多说,直接开测!

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

通过这次对比,Qwen2-72B 在多语言处理、代码生成、数学推理、长文本处理、自然语言、指令遵循等方面表现出色,展现了其强大的技术实力。与 Llama3-70B 相比,Qwen2-72B 在很多方面表现更为优异,特别是在细节处理复杂任务的执行上。然而,Llama3-70B 在简洁明了的回答和快速响应上也有其优势,适合需要快速解决问题的场景。

总体来说,Qwen2-72B凭借其全面的性能和卓越的表现,确实堪称AI大模型开源版”国货之光这不仅展示了国产大模型的崛起,也为未来国产AI技术的进一步发展和国际市场的竞争奠定了基础。

期待 Qwen2-72B 在更多实际应用中继续发挥其强大的功能,为用户带来更优质的体验。

打开网易新闻 查看精彩图片