来了，Claude再进化！编程能力超越GPT，还能一键操控电脑！

运营黑客

2024-10-25 09:21 ·湖南

不愧是 OpenAI 的最强对手，就在昨天，Anthropic 放出大动作：

→ 推出升级版Claude 3.5 Sonnet；
→ 首发模型Claude 3.5 Haiku；
→ 推出新功能——computer use（一个可以掌控电脑的 AI）。

每一个都很厉害。

接下来，我们逐一为大家介绍。

01Claude 3.5 Sonnet

新版的Claude 3.5 Sonnet 模型，在跑分测试上，轻松超越了曾经的自己和 GPT-4o。

在编程能力上，更是完全碾压其他模型。

有意思的是，新版本的Claude 3.5 Sonnet 知识库截止日期仍然是2024年4月。

说明Anthropic是为其增加了强化学习的合成数据以及“计算机操控”训练。

除此之外，最令人惊喜的是，新版本Claude 3.5 Sonnet 模型已经可以在 Claude 账号上体验了。

02 Claude 3.5Haiku

Claude 模型一直分为三个版本，分别是 Opus、Sonnet、Haiku。

这一次，Anthropic 放出的新模型就是——Claude 3.5 Haiku。

作为 Claude 3.5 系列速度最快的版本，Haiku 对标的就是 GPT-4o mini 等敏捷系列的模型。

从跑分情况上来看，Claude3.5Haiku 基本也做到了全面领先。

03 computer use

computer use（自动操控计算机），这应该是Anthropic丢出最令人惊艳的功能。

用大白话来说：就是现在你可以指挥 Claude 操控电脑了！无论是屏幕视觉、鼠标移动，还是点击、交互和文本输入等等都不在话下。

这个功能是怎么实现的呢？

在 Anthropic 官方文档中，是这样介绍的：

第一步：提供 Claude 操控电脑的工具和 prompt（如下图）。

将 Anthropic 定义的电脑操控工具添加到 API 请求中，包括使用工具的 prompt。

第二步：由 Claude 选择执行操作的工具。

Claude 会辨别已有的工具，并评估是否有工具可以用于执行操作。如果有，Claude 就会提交一个工具使用请求。

第三步：提取工具输入信息，运行工具并返回结果。

第四步：Claude 继续调用工具，直到完成全部任务。

这里，Claude 还可以实现“代理循环”——即使是在没有额外输入内容的情况下，它可以重复步骤3和4，直到完成复杂任务。

比如，一句话，让电脑自行搜索最适合的景点↓

又或者，输入需求，电脑自动为用户提供导航↓

据官方介绍：这个功能还在测试中，有时很麻烦且容易出错。我们将提前发布 Computer Use 以征求开发人员的反馈，并预计该功能将随着时间的推移而迅速改进。

目前，想体验这个功能的话，只能通过 Api 使用。

最后，说说使用它们 Api 的价格：

在正常使用的情况下（Batch 半价）：

输入：$3/100万 token
输出：$15/100万 token

如果选择提示缓存（此前Claude发布的prompt catching功能，能让输出token价格降到输入token的10%）：

输入: $3.75 / 100万 token
输出：$0.30 / 100万 token

感兴趣的小伙伴可以去试试，让你的电脑编程「AI 脑」。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴