不愧是 OpenAI 的最强对手,就在昨天,Anthropic 放出大动作:

→ 推出升级版Claude 3.5 Sonnet;
→ 首发模型Claude 3.5 Haiku
→ 推出新功能——computer use(一个可以掌控电脑的 AI)。

每一个都很厉害。

打开网易新闻 查看精彩图片

接下来,我们逐一为大家介绍。

01Claude 3.5 Sonnet

新版的Claude 3.5 Sonnet 模型,在跑分测试上,轻松超越了曾经的自己和 GPT-4o。

编程能力上,更是完全碾压其他模型。

打开网易新闻 查看精彩图片

有意思的是,新版本的Claude 3.5 Sonnet 知识库截止日期仍然是2024年4月。

说明Anthropic是为其增加了强化学习的合成数据以及“计算机操控”训练。

除此之外,最令人惊喜的是,新版本Claude 3.5 Sonnet 模型已经可以在 Claude 账号上体验了。

打开网易新闻 查看精彩图片

02 Claude 3.5Haiku

Claude 模型一直分为三个版本,分别是 Opus、Sonnet、Haiku。

这一次,Anthropic 放出的新模型就是——Claude 3.5 Haiku。

作为 Claude 3.5 系列速度最快的版本,Haiku 对标的就是 GPT-4o mini 等敏捷系列的模型。

打开网易新闻 查看精彩图片

从跑分情况上来看,Claude3.5Haiku 基本也做到了全面领先。

03 computer use

computer use(自动操控计算机),这应该是Anthropic丢出最令人惊艳的功能。

用大白话来说:就是现在你可以指挥 Claude 操控电脑了!无论是屏幕视觉、鼠标移动,还是点击、交互和文本输入等等都不在话下。

这个功能是怎么实现的呢?

在 Anthropic 官方文档中,是这样介绍的:

第一步:提供 Claude 操控电脑的工具和 prompt(如下图)。

打开网易新闻 查看精彩图片

将 Anthropic 定义的电脑操控工具添加到 API 请求中,包括使用工具的 prompt。

第二步:由 Claude 选择执行操作的工具。

Claude 会辨别已有的工具,并评估是否有工具可以用于执行操作。如果有,Claude 就会提交一个工具使用请求。

第三步:提取工具输入信息,运行工具并返回结果。

第四步:Claude 继续调用工具,直到完成全部任务。

这里,Claude 还可以实现“代理循环”——即使是在没有额外输入内容的情况下,它可以重复步骤3和4,直到完成复杂任务。

比如,一句话,让电脑自行搜索最适合的景点

打开网易新闻 查看精彩图片

又或者,输入需求,电脑自动为用户提供导航

打开网易新闻 查看精彩图片

据官方介绍:这个功能还在测试中,有时很麻烦且容易出错。我们将提前发布 Computer Use 以征求开发人员的反馈,并预计该功能将随着时间的推移而迅速改进。

目前,想体验这个功能的话,只能通过 Api 使用

最后,说说使用它们 Api 的价格

在正常使用的情况下(Batch 半价):

输入:$3/100万 token
输出:$15/100万 token

如果选择提示缓存(此前Claude发布的prompt catching功能,能让输出token价格降到输入token的10%):

输入: $3.75 / 100万 token
输出:$0.30 / 100万 token

感兴趣的小伙伴可以去试试,让你的电脑编程「AI 脑」。