今天凌晨,OpenAI 发布了一个全新的模型——GPT-4o mini。

并表示:即日起,开放给所有 ChatGPT 用户

这里的所有用户,不仅包括 OpenAI 的付费 Plus、企业号、Team 账号,同样也包括所有的免费账号

打开网易新闻 查看精彩图片

也就是说,只要你注册了的 ChatGPT,就可以直接使用最新版的 GPT-4o mini 模型了。

打开网易新闻 查看精彩图片

我们用一个免费 ChatGPT 账号测试了一下,发现确实如此。

而这也标志着,ChatGPT 正式进入“4.0”时代

打开网易新闻 查看精彩图片

作为 GPT-3.5 Turbo 的替代品——GPT-4o mini,是 GPT-4o 更小参数量的简化版本。

尽管量级小,但功能并不弱。

专业机构测试后表示:GPT-4o mini 性能比 GPT-4 更好,大约有 GPT-4o 80% 的能力。

01 GPT-4o mini 能力介绍

根据 OpenAI 公布的测试数据显示:

GPT-4o mini 拥有非常好的数学、编码、视觉等推理能力

GPT-4o mini MMLU 得分为82.0%,而谷歌的 Gemini Flash 为77.9%,Anthropic 的 Claude Haiku 为 73.8%;

数学和编码方面,GPT-4o mini在 MGSM 测试中得分为87.0%,而 Gemini Flash 为 75.5%,Claude Haiku为 71.7%;

GPT-4o mini 在衡量编码性能的 Human Eval上 得分为87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。

打开网易新闻 查看精彩图片

此外,在多模态推理 MMMU 中,GPT-4o mini 也表现出色,得分为59.4%,力压 Gemini Flash 的 56.1%,以及 Claude Haiku 的 50.2%。

尤为显眼的是,GPT-3.5 Turbo 在这些基准测试中的得分均不如 GPT-4o mini,甚至可以说被全面碾压。

甚至,在大模型盲测竞技场 LMSYS 中的表现也要优于 GPT-4T 01-25。

02 GPT-4o mini Api

除了模型强大之外,GPT-4o mimi 的 Api 价格同样令人惊喜。

每百万输入tokens,15美分(约1.09元人民币)
每百万输出tokens,60美分(约4.36元人民币)

也就是说,GPT-4o mini 创作一本 100 万字的小说,只需要不到 5 块钱的价格!

甚至,比 GPT-3.5 Turbo 便宜超过 60%。

打开网易新闻 查看精彩图片

OK,今天的分享就到这里。

有 ChatGPT 账号的小伙伴赶紧去体验一下吧。

打开网易新闻 查看精彩图片