法国初创公司 Mistral AI 今天宣布推出 Large 2,这是其新的旗舰机型,在代码生成、数学和推理方面的能力大大增强。Mistral 还在 Large 2 中增加了更好的多语言支持和高级函数调用功能。

打开网易新闻 查看精彩图片

Mistral Large 2 型号有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行。它支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、汉语、日语和韩语。在编码方面,它支持 80 多种编码语言,包括 Python、Java、C、C++、JavaScript 和 Bash。

Mistral Large 2 现已开放权重,但只能免费用于研究和非商业用途。商业用途需获得模型许可。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在编程基准测试中,Mistral Large 2 (123B) 的性能可与 OpenAI 的 GPT-4o、Claude Opus 3 和最近发布的 Meta 的 Llama 3.1 405B相媲美。在 Wild Bench、Arena Hard 和 MT Bench 基准测试中,Large 2 的表现优于 Llama 3.1 405B 和 Claude 3 Opus。在流行的 MMLU 基准测试中,这款新型号的表现优于 Llama 3.1 70B,与 Llama 3.1 405B 不相上下。

对于开发人员来说,Mistral Large 2 现在具有改进的函数调用和检索技能。它现在可以执行并行和顺序函数调用,使开发人员能够构建复杂的商业人工智能应用。

随着 Large 2 的发布,Mistral 正在整合其模型组合。它将拥有两个通用机型 Mistral Nemo 和 Mistral Large,以及两个专业机型 Codestral 和 Embed。未来,Mistral 将停产 Apache 型号(Mistral 7B、Mistral 8x7B 和 8x22B、Codestral Mamba、Mathstral)。

打开网易新闻 查看精彩图片

微软 和 Mistral 已经建立了合作关系,在 Azure 上提供 Mistral 模型。今天,Mistral 将其合作伙伴关系扩展到Google,在Google云上提供 Mistral 模型。

Mistral Large 2 和 Llama 3.1 的连续发布标志着开放人工智能生态系统的一个重要里程碑,为研究和开发提供了两个强大的 GPT-4 级模型。这一突飞猛进的进展推动了人工智能向更加开放和协作的方向发展。

https://mistral.ai/news/mistral-large-2407/