xAI发布Grok-2测试版，并已面向X付费用户开放|grok|xai|推理

继此前在上月马斯克透露AI大模型Grok-2将于8月发布后，日前xAI方面宣布，正式推出Grok-2和Grok-2 mini的Beta版本。据xAI方面透露，Grok-2是其上一代大模型Grok-1.5的重大升级，在聊天、编码和推理方面具有更前沿的能力，而Grok-2 mini则被描述为“体型虽小、但功能强大的兄弟产品”，可在速度和回答质量之间取得平衡。此外，Grok-2在对检索到的内容进行推理，以及工具使用能力方面有着显著的改进，例如正确识别缺失信息、通过事件序列进行推理，以及丢弃不相关的信息等。

据xAI方面公布的信息显示，已在LMSYS聊天机器人竞技场中引入了名为“sus-column-r”的Grok-2早期版本，该模型的Elo总分已超过Claude和GPT-4。同时Grok-2和Grok-2 mini在研究生水平科学知识（GPQA）、常识（MMLU、MMLU-Pro）和数学竞赛问题（MATH）等领域的表现，均能与其他同类模型相媲美。而在视觉数学推理（MathVista）和基于文档的问答（DocVQA）方面，Grok-2则提供了最先进的性能。

值得一提的是，目前Grok-2和Grok-2mini的测试版已在X平台（原推特）面向其Premium和Premium+订阅用户开放。同时xAI方面还标识，计划在本月晚些时候通过新的API面向开发人员提供这两款大模型，以及“我们即将推出的API基于全新的定制技术堆栈，允许多区域推理部署、可实现全球低延迟访问。此外还提供了增强的安全功能，如强制性多因素身份验证（如使用Yubikey、Apple TouchID或TOTP）、丰富的流量统计和高级计费分析（包括详细的数据导出）”。

xAI方面透露，很快将发布具有多模态理解能力的Grok-2和Grok-2 mini预览版，并作为用户在X平台和API上体验Grok系列模型的核心部分。

【本文图片来自网络】