机器之心报道

编辑:侯江龙、陈陈

用的多,花的多,账单如流水。

AI 编程神器 Cursor 新鲜出炉 Claude Max 模式(MAX 代表了最大智能)!这波操作有点猛。

其核心优势在于处理大规模代码和复杂逻辑时表现出色,适合硬核开发者和大型项目。

打开网易新闻 查看精彩图片

Claude Max 是 Claude 3.7 的一种更强大配置,它以 Claude 3.7 Thinking 模型为基础。具有超强的创造力,能在其他模型失灵时脱颖而出,解决更复杂、更精妙的任务。

其次,它的上下文窗口高达 200K,这意味着你可以尽可能多地将代码放入提示中。以前的模型在处理这类任务时表现不佳,但 Claude 3.7 是第一个在处理如此大的上下文窗口时表现更好的模型。

此外,Claude Max 将工具调用限制提高到了 200 次,这意味着它可以一次性进行大量编辑,并在整个代码库中收集上下文!

最后,它可以一次性读取更大块的代码。

不过,想要尝试的小伙伴要悠着点了,可能一个不小心就榨干你的钱包,因为 Claude Max 收费不包含在标准 Pro 订阅中,每次请求和工具调用均需支付额外的费用:即采用按使用量计费的方式,每次请求(prompt)收费 0.05 美元,每次工具调用收费 0.05 美元;对于大多数用户来说,可能不值得花费这些钱。

如果不加以控制,Claude Max 在完成其可用的 200 次工具调用后,可能会花费你 10 美元。

只能说,复杂点的项目可以尝试一下,一般项目用其他模型应该就够用了。

现在,X 上已经有用户在晒使用体验了。

Cursor重磅上线Claude Max
打开网易新闻 查看更多视频
Cursor重磅上线Claude Max

视频来源:https://x.com/MervinPraison/status/1901876045185159295

不过,很多人还是被它的高收费劝退了:谁能想到,以后编程也要氪金了。

打开网易新闻 查看精彩图片

「自己让 Claude Max 帮我改完代码后,xcode 出现了一万多个报错。」

打开网易新闻 查看精彩图片

还有网友抱怨一个任务跑下来,花费自己十几块钱。

打开网易新闻 查看精彩图片

「调用工具 0.05 美元 一次,有时候一轮下来至少调 20 次工具。真是用不起。」

打开网易新闻 查看精彩图片

效果到底咋样,机器之心上手体验了一番。

一手体验

要使用「黑科技」Claude 3.7 Max,首先需要安装它。目前直接从官网的界面中点击下载的版本(0.47.5)是找不到对应的 Max 模式的。

打开网易新闻 查看精彩图片

因此这里在安装它的时候需要从 Cursor 官网中的「ALL Downloads」列表中手动查找并下载最新版本,经测试版本为 0.47.8 的 Cursor 支持 Claude 3.7 Max。

打开网易新闻 查看精彩图片

在安装完对应版本的 Cursor 之后,便可进入到交互界面。

打开网易新闻 查看精彩图片

接下来我们来感受一下 Claude Max 的强大编程性能,我们先来通过一个小球碰撞测试,将 Claude Max 与其他模型进行对比,来测试一下小球碰撞的物理模拟效果。

提示词:编写一个 Python 程序,显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。

打开网易新闻 查看精彩图片

为了验证 Claude Max 在物理模拟中的表现,我们运行了由其生成的代码,整个过程耗时约 20 多秒。

打开网易新闻 查看精彩图片

通过观察小球的运动轨迹,可以直观感受到 ChatGPT-4.0 和 Claude Max 对重力和摩擦力模拟的差距,这一对比结果从侧面反映出 Claude Max 在代码编程上有着出色的表现。

接下来,我将测试场景转向了更为复杂的 3D 模拟赛车游戏,同样基于 Claude Max 版本进行,以下是该测试的结果输出展示。

提示词:为我构建一款 3D 模拟赛车,让我在场景中感受驾驶。

打开网易新闻 查看精彩图片

此次生成过程大约持续了 3 - 5 分钟,现在就让我们一同来检验一下生成的效果如何吧。

打开网易新闻 查看精彩图片

虽然生成过程有点长,但令人意外的是,生成的 3D 模拟赛车游戏具备同时切换多种视角的功能。

事实上,Claude 系列带给我们的惊喜远不止于此。前几天就有网友借助 Claude 成功打造出一款简单又好玩的 3D 赛车游戏。

打开网易新闻 查看精彩图片

Claude 3.7 Max 的另一大优势是强大的应用开发能力,这为我们提供了无限的想象空间。例如,我们可以让 Claude 3.7 Max 生成一个 AI 记账 App,用的是 Agent 模式,以下是输出结果展示。

提示词:请帮我从 0-1 编写一个记账 App。

打开网易新闻 查看精彩图片

整个过程耗时 8 分钟左右,以上动图有适当加速。

打开网易新闻 查看精彩图片

而且生成过程中会有中断,我们需要通过提示词继续让 Claude Max 进行输出才能生成完整的代码文件。值得一提的是,在测试过程中曾遇到报错,经过个人调试后才成功实现了如上图所示的结果。

总体而言,这次体验基本顺利,Claude Max 的表现有令人惊喜之处。它不仅能够辅助程序员进行应用开发,还能优化个人的财务规划。然而,距离完全智能化仍有改进空间,期待未来的进一步优化与提升。

https://forum.cursor.com/t/claude-3-7-max-out-now/65698/6