• 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI

欧洲的OpenAI,把ChatGPT功能都复制了。

Mistral AI大模型平台Le Chat新增Canvas、联网搜索、上传PDF等ChatGPT同款功能,而且全都免!费!

三大主流大模型产品的功能,现在可以一站式访问。

打开网易新闻 查看精彩图片

而且还官宣和知名绘图模型Flux达成合作,在Le Chat平台提供在线生图功能,同样是不收一分钱。

打开网易新闻 查看精彩图片

经量子位简单实测发现,搜索、文档总结和绘图这些新功能都支持中文

打开网易新闻 查看精彩图片

Mistral的CEOArthur Mensch表示,这次的新版Le Chat是一个里程碑,标志着该平台已经成为“更成熟的动物”。

打开网易新闻 查看精彩图片

ChatGPT同款功能免费用

ChatGPT同款功能免费用

在Mistral的官方平台Le Chat(看上去是chat,但实际上是法语的“猫”)上,免费上新了一系列ChatGPT同款功能。

从Mistral官方发布的表格来看,除了o1和语音对话,其他功能基本都安排了。

其中也包括OpenAI最新上线的高级界面Canvas,在ChatGPT中该功能目前还是会员专属。

打开网易新闻 查看精彩图片

在Le Chat的Canvas当中,可以单独展示生成的文稿,而不必再从对话中手动提取。

打开网易新闻 查看精彩图片

代码也可以如法炮制,并支持实时预览,还能选中局部代码要求做出修改。

打开网易新闻 查看精彩图片

再来是联网搜索,和ChatGPT一样,Le Chat可以根据问题进行在线搜索总结,并附上来源信息,而且速度非常快。

打开网易新闻 查看精彩图片

另外,现在的Le Chat已经能够处理复杂的PDF文档和图像,并进行分析和总结,包括其中的表格、图表、文本、公式、方程等内容。

在下面的示例中,Le Chat对爱因斯坦等人1935年撰写的著名量子纠缠论文进行了信息提取、概括和语义理解。

打开网易新闻 查看精彩图片

除了分析图片,最新的Le Chat也支持了文生图,不过Mistral暂未自研此类模型,而是选择了与Flux合作,接入其模型。

打开网易新闻 查看精彩图片

还可以创建并在对话中@智能体,智能执行一些任务,但是目前创建页面只有法语……

打开网易新闻 查看精彩图片

不过,目前Mistral已经发布的模型尚未拓展至语音模态,因此ChatGPT中的高级语音对话功能,Le Chat是没有的,另外也没有桌面客户端。

所以,虽然Mistral此举被视为在功能上对ChatGPT的追赶,但离真正追上还存在一定的距离,不过倒是胜在免费(手动狗头)。

多模态模型大号版上线

多模态模型大号版上线

在Le Chat中提供图像分析功能的,正是今天同时发布的大号版多模态大模型Pixtral Large

它拥有124B参数量,包括一个123B参数的解码器和一个1B参数的视觉编码器,此前Mistral曾经发布了小号的12B版本。

上下文窗口为128k,相当于可以一次性处理至少30张高分辨率图像。

功能上Pixtral Large支持多语言OCR识别,并在此基础上进行推理

打开网易新闻 查看精彩图片

也能看懂图表并分析其中的趋势。

打开网易新闻 查看精彩图片

同时,Pixtral Large在训练的过程当中还考虑到了前端应用,对此Mistral的CEO Arthur Mensch解释道:

从Mistral的成长经历中我们意识到,要想创造好的AI体验,需要模型和产品界面的协同设计。
Pixtral就是一个很好的例子,它在训练过程中充分考虑了前端应用。

打开网易新闻 查看精彩图片

而至于模型本身的性能,按照Mistral的说法,Pixtral Large是目前的SOTA视觉模型。

在MMMU、MathVista、ChartQA等六个不同任务类型的数据集中,Pixtral Large取得了超过或接近与Gemini-1.5 Pro和GPT-4o的成绩,相对Claude-3.5 Sonnet优势更为明显,在开源模型中更是远远超过Llama-3.2 90B。

此外Mistral团队还以GPT-4o作为评价者,使用其自己开源的MM-MT-Bench基准进行了测试,结果Pixtral Large领先于其他模型,包括既当裁判员又当运动员的GPT-4o。

打开网易新闻 查看精彩图片

有网友看了Pixtral的成绩后表示,Benchmark很快又需要更新了。

打开网易新闻 查看精彩图片

不过在Reddit上,有人提出质疑,表示Pixtral可能并没有达到SOTA水准——

Mistral官方只将Pixtral和少数模型做了比较,其中开源模型只比较了Llama-3.2 90B

但实际在多个数据集上,Qwen2-VL(最大版参数量72B)的表现比Pixtral更强。

同时在部分数据集中,Pixtral的测试成绩也不如Molmo(由西雅图一家名为Ai2的非营利研究机构开发)。

打开网易新闻 查看精彩图片

而且有人实测之后说,在他测试的含有日文的图片中,Pixtral Large的识别能力还不如Qwen的7B版本。

打开网易新闻 查看精彩图片

那么,你觉得Mistral的新产品到底好不好用呢?

参考链接:
[1]https://mistral.ai/news/mistral-chat/
[2]https://mistral.ai/news/pixtral-large/
[3]https://www.reddit.com/r/LocalLLaMA/comments/1gu7cm8/mistral_large_2411_and_pixtral_large_reLease_18th/