力压GPT-4o丨Claude 3.5深夜炸场，更好更强大！

运营黑客

2024-06-21 19:42 ·湖南

今天凌晨，Anthropic 推出迄今为止最强模型：Claude3.5Sonnet。

作为Claude3.5 系列的排头兵，Claude3.5Sonnet各项评估指数力压Claude 3 Opus 和 GPT-4o。

更厉害的是：它免费可用！

今年的AI行业，真是太精彩了！

OpenAI 不再一家独大，Anthropic接连推出Claude 3.0、Claude3.5 系列模型，力压之前的 GPT-4，以及现在的 GPT-4o。

GPT-5 如果再不出来，OpenAI 最强大模型的王座，将岌岌可危。

言归正传。

Claude 3.5 Sonnet是 Claude 3.5 系列的首个模型，今年晚些时候，Anthropic还会陆续推出Claude 3.5 Haiku和Claude 3.5 Opus等版本。

从 Claude 3 系列开始，Anthropic 将模型分为Opus、 Sonnet和Haiku3个版本。

大家可以把它们理解成Opus（大杯）、Sonnet（中杯）、Haiku（小杯）。

而这一次，是把中等参数模型 Sonnet 的 3.5 升级版放了出来。

Claude 3.5 Sonnet 在哪些方面做了升级？

▶更强的指令理解、内容创作能力（可以理解为——更通人性）；
▶基准测试全面碾压 Gemini 1.5 Pro、Llama-400b，大部分优于 GPT-4o；
▶输出速度更快（是 Claude 3 Opus 的两倍）；
▶成本更低（API 成本是Claude 3 Opus 的五分之一）；
▶在编码、视觉处理等复杂任务中表现出色。

拿视觉处理能力来说：Claude 3.5 Sonnet 在所有标准视觉基准上都超过了 Claude 3 Opus。

甚至几乎全面强于，GPT-4o。

下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。

编码能力是 Claude 3.5 Sonnet 进化的重点之一，

在内部编码评估中，Claude 3.5 Sonnet 解决了 64% 的问题。相比之下，Claude 3 Opus 只解决了 38%，差距不止一点点。

新功能——Artifacts。

Artifacts是一项扩展用户与 Claude 交互方式的新功能。

当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时，这些工具会出现在他们的对话旁边的专用窗口中。

Artifacts创建了一个动态工作空间，用户可以在其中实时查看、编辑和构建 Claude 的创作，将人工智能生成的内容无缝集成到用户的项目和工作流当中。

Artifacts 将很快扩展到支持团队协作。

在不久的将来，团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中，而 Claude 则将充当我们的最强 AI 队友。

OK，今天的分享就到这里。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴