今天凌晨,Anthropic 推出迄今为止最强模型:Claude3.5Sonnet

作为Claude3.5 系列的排头兵,Claude3.5Sonnet各项评估指数力压Claude 3 Opus 和 GPT-4o。

更厉害的是:它免费可用!

打开网易新闻 查看精彩图片

今年的AI行业,真是太精彩了!

OpenAI 不再一家独大,Anthropic接连推出Claude 3.0、Claude3.5 系列模型,力压之前的 GPT-4,以及现在的 GPT-4o。

GPT-5 如果再不出来,OpenAI 最强大模型的王座,将岌岌可危。

言归正传。

Claude 3.5 Sonnet是 Claude 3.5 系列的首个模型,今年晚些时候,Anthropic还会陆续推出Claude 3.5 HaikuClaude 3.5 Opus等版本。

从 Claude 3 系列开始,Anthropic 将模型分为Opus、 SonnetHaiku3个版本

大家可以把它们理解成Opus(大杯)Sonnet(中杯)Haiku(小杯)

而这一次,是把中等参数模型 Sonnet 的 3.5 升级版放了出来。

Claude 3.5 Sonnet 在哪些方面做了升级?

▶更强的指令理解、内容创作能力(可以理解为——更通人性);
▶基准测试全面碾压 Gemini 1.5 Pro、Llama-400b,大部分优于 GPT-4o;
▶输出速度更快(是 Claude 3 Opus 的两倍);
▶成本更低(API 成本是Claude 3 Opus 的五分之一);
▶在编码、视觉处理等复杂任务中表现出色。

打开网易新闻 查看精彩图片

视觉处理能力来说:Claude 3.5 Sonnet 在所有标准视觉基准上都超过了 Claude 3 Opus。

甚至几乎全面强于,GPT-4o。

下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。

打开网易新闻 查看精彩图片

编码能力是 Claude 3.5 Sonnet 进化的重点之一,

在内部编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题。相比之下,Claude 3 Opus 只解决了 38%,差距不止一点点。

打开网易新闻 查看精彩图片

新功能——Artifacts

Artifacts是一项扩展用户与 Claude 交互方式的新功能。

当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些工具会出现在他们的对话旁边的专用窗口中。

Artifacts创建了一个动态工作空间,用户可以在其中实时查看、编辑和构建 Claude 的创作,将人工智能生成的内容无缝集成到用户的项目和工作流当中。

打开网易新闻 查看精彩图片

Artifacts 将很快扩展到支持团队协作。

在不久的将来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 则将充当我们的最强 AI 队友。

OK,今天的分享就到这里。

打开网易新闻 查看精彩图片