“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClaw
财闻
·上海
·浙江财闻互讯传媒有限公司官方账号
当地时间3月7日,OpenClaw 创始人 Peter Steinberger 在平台X上分享龙虾基准测试排行榜。PinchBench 测试了32款主流大模型,从成功率、速度、费用三个维度,测试哪个模型最适合养龙虾。
排行榜显示,谷歌(GOOGL.US)的Gemini 3 Flash Preview 以95.1% 的成功率夺冠,其次是国产模型 MiniMax M2.1,成功率93.6%,战胜 Claude Sonnet 4.5(92.7%)和 GPT-4o(85.2%)等一众国际大模型。
Kimi K2.5则以93.4%的成功率紧随其后,位居第三。至此,国产双雄直接占据了 TOP3的两个席位。
打开网易新闻 查看精彩图片
热门跟贴