今天凌晨,Anthropic 推出迄今为止最强模型:Claude3.5Sonnet。
作为Claude3.5 系列的排头兵,Claude3.5Sonnet各项评估指数力压Claude 3 Opus 和 GPT-4o。
更厉害的是:它免费可用!
今年的AI行业,真是太精彩了!
OpenAI 不再一家独大,Anthropic接连推出Claude 3.0、Claude3.5 系列模型,力压之前的 GPT-4,以及现在的 GPT-4o。
GPT-5 如果再不出来,OpenAI 最强大模型的王座,将岌岌可危。
言归正传。
Claude 3.5 Sonnet是 Claude 3.5 系列的首个模型,今年晚些时候,Anthropic还会陆续推出Claude 3.5 Haiku和Claude 3.5 Opus等版本。
从 Claude 3 系列开始,Anthropic 将模型分为Opus、 Sonnet和Haiku3个版本。
大家可以把它们理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。
而这一次,是把中等参数模型 Sonnet 的 3.5 升级版放了出来。
Claude 3.5 Sonnet 在哪些方面做了升级?
▶更强的指令理解、内容创作能力(可以理解为——更通人性);
▶基准测试全面碾压 Gemini 1.5 Pro、Llama-400b,大部分优于 GPT-4o;
▶输出速度更快(是 Claude 3 Opus 的两倍);
▶成本更低(API 成本是Claude 3 Opus 的五分之一);
▶在编码、视觉处理等复杂任务中表现出色。
拿视觉处理能力来说:Claude 3.5 Sonnet 在所有标准视觉基准上都超过了 Claude 3 Opus。
甚至几乎全面强于,GPT-4o。
下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。
编码能力是 Claude 3.5 Sonnet 进化的重点之一,
在内部编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题。相比之下,Claude 3 Opus 只解决了 38%,差距不止一点点。
新功能——Artifacts。
Artifacts是一项扩展用户与 Claude 交互方式的新功能。
当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些工具会出现在他们的对话旁边的专用窗口中。
Artifacts创建了一个动态工作空间,用户可以在其中实时查看、编辑和构建 Claude 的创作,将人工智能生成的内容无缝集成到用户的项目和工作流当中。
Artifacts 将很快扩展到支持团队协作。
在不久的将来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 则将充当我们的最强 AI 队友。
OK,今天的分享就到这里。
热门跟贴