LMSYS Org 更新基准测试报告，Claude-3 超越 GPT-4

硅星Breaknews

2024-03-28 16:31 ·上海

品玩3月28日讯，LMSYS Org 近日公布最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。

根据LMSYS Org 旗下的基准测试平台 Chatbot Arena显示，Anthropic 的 Claude 3 Opus 以 1253 比 1251 的微弱优势击败了 GPT-4，OpenAI 的 LLM 被挤下了榜首位置。由于比分过于接近，出于误差率方面的考量，该机构让 Claude 3 和 GPT-4 并列第一，GPT-4 的另一个预览版也并列第一。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴