今天凌晨,OpenAI 发布了一个全新的模型——GPT-4o mini。
并表示:即日起,开放给所有 ChatGPT 用户。
这里的所有用户,不仅包括 OpenAI 的付费 Plus、企业号、Team 账号,同样也包括所有的免费账号。
也就是说,只要你注册了的 ChatGPT,就可以直接使用最新版的 GPT-4o mini 模型了。
我们用一个免费 ChatGPT 账号测试了一下,发现确实如此。
而这也标志着,ChatGPT 正式进入“4.0”时代。
作为 GPT-3.5 Turbo 的替代品——GPT-4o mini,是 GPT-4o 更小参数量的简化版本。
尽管量级小,但功能并不弱。
专业机构测试后表示:GPT-4o mini 性能比 GPT-4 更好,大约有 GPT-4o 80% 的能力。
01 GPT-4o mini 能力介绍
根据 OpenAI 公布的测试数据显示:
√GPT-4o mini 拥有非常好的数学、编码、视觉等推理能力;
√GPT-4o mini MMLU 得分为82.0%,而谷歌的 Gemini Flash 为77.9%,Anthropic 的 Claude Haiku 为 73.8%;
√在数学和编码方面,GPT-4o mini在 MGSM 测试中得分为87.0%,而 Gemini Flash 为 75.5%,Claude Haiku为 71.7%;
√GPT-4o mini 在衡量编码性能的 Human Eval上 得分为87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。
此外,在多模态推理 MMMU 中,GPT-4o mini 也表现出色,得分为59.4%,力压 Gemini Flash 的 56.1%,以及 Claude Haiku 的 50.2%。
尤为显眼的是,GPT-3.5 Turbo 在这些基准测试中的得分均不如 GPT-4o mini,甚至可以说被全面碾压。
甚至,在大模型盲测竞技场 LMSYS 中的表现也要优于 GPT-4T 01-25。
02 GPT-4o mini Api
除了模型强大之外,GPT-4o mimi 的 Api 价格同样令人惊喜。
→每百万输入tokens,15美分(约1.09元人民币)
→每百万输出tokens,60美分(约4.36元人民币)
也就是说,GPT-4o mini 创作一本 100 万字的小说,只需要不到 5 块钱的价格!
甚至,比 GPT-3.5 Turbo 便宜超过 60%。
OK,今天的分享就到这里。
有 ChatGPT 账号的小伙伴赶紧去体验一下吧。
热门跟贴