大家好,我是Ai学习的老章

要说我最喜爱的编程类大模型,必须是Claude-3.5-Sonnet,没有之一

它永远是我的默认

可惜我的Cursor取消订阅了,Windsurf还未更新Claude-3.7-sonnet-thinking

简单介绍Claude 3.7

先简单介绍一下3.7如何强悍吧

一句话总结:它可以一次性完成复杂编程任务,大幅降低开发者的工作量。

主要能力:

  • 代码搜索与阅读

  • 自动化代码编辑

  • 编写和运行测试

  • GitHub 代码提交

  • 使用命令行工具

打开网易新闻 查看精彩图片

Claude-3.7-sonnet 实战演示

请看VCR

 地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示
打开网易新闻 查看更多视频
地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示

这段视频展示了人工智能在帮助你理解复杂主题方面的真正潜力。请注意,万一分析不够充分,你可以向 Claude 3.7 索要一个模拟器。code & reasoning.相结合的神奇之处。

 地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示
打开网易新闻 查看更多视频
地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示

在一个提示下创建了《我的世界》克隆体,并使其在工件中立即可以玩。

 地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示
打开网易新闻 查看更多视频
地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示

在 Claude 3.7 Sonnet(思考模式)中尝试了这个提示,它甚至生成了一些控制项。

Claude 3.7 Sonnet 与 Claude Code 功能定位、核心功能、性能亮点

Claude 3.7 Sonnet

  • 定位:目前Anthropic最智能的模型,也是市场上首个混合推理模型

  • 核心特点:

    • 一个模型同时支持两种工作模式:快速回复和扩展思考

    • 在API中,用户可以控制模型思考的token数量(最高128K),平衡速度、成本和回答质量

    • 特别强化了编程和前端开发能力

  • 性能亮点:

    • 在SWE-bench Verified和TAU-bench等实际软件开发基准测试中达到了最先进水平

    • 指令遵循、通用推理、多模态和编码能力都有显著提升

    • 被多家合作伙伴(Cursor、Cognition、Vercel、Replit、Canva)评为编码能力最佳

  • 可用性:

    • 所有Claude计划都可使用(免费版、专业版、团队版和企业版)

    • 也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用

    • 扩展思考模式除免费版外所有平台均可使用

    • 价格保持不变:输入 百 万 , 输 出 15/百万tokens(包括思考tokens)

Claude Code

  • 定位:Anthropic首个智能编码工具,目前处于有限研究预览阶段

  • 功能:

    • 可以搜索和阅读代码、编辑文件、编写和运行测试

    • 能够提交和推送代码到GitHub,使用命令行工具

    • 在每个步骤都保持用户参与

  • 实用效果:

    • 已在Anthropic团队内部成为不可或缺的工具

    • 特别适合测试驱动开发、复杂问题调试和大规模重构

    • 早期测试表明可以一次性完成通常需要45+分钟手动工作的任务

其他更新

  • GitHub集成现已在所有Claude计划中可用

  • 安全性改进:与前代相比,不必要的请求拒绝减少了45%

  • 发布了系统卡片(system card),详细介绍了责任扩展政策评估

Claude 3.5 本身就是 AI 编程实践中的最佳模型。Claude 3.7 则进一步巩固优势,提升了 20%,妥妥第一了。

并且官方特别强调,这次针对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映用户需求的现实任务。

Claude3.7 还是一个混合推理模型,开启推理模式后,推理和数学相关任务指标也会提升,但是并未达到 o1 grok3 这样的专门的推理模型的水平。

Claude 3.7 Sonnet 和 Claude Code 标志着朝着能够真正增强人类能力的 AI 系统迈出了重要一步。

Claude 5年计划

Claude正在经历从2024年的基础辅助功能,到2025年的专家级协作能力,最终发展为2027年能够解决需要团队数年才能攻克的复杂问题的智能系统

  1. 2024年 - Claude 协助: 在这一阶段,Claude主要帮助个人更好地完成当前工作,提高效率,让每个人都能发挥最佳潜力。图中显示Claude正处于这一"协助"阶段。

  2. 2025年 - Claude 协作: 这是目前正在过渡的阶段。在2025年,Claude将能够独立完成数小时的专业级工作,与专家水平相当,扩展人们和团队的能力边界。Claude将成为真正的协作伙伴。

参考:

Claude 3.7 Sonnet and Claude Code[1]

claude-3-7-sonnet-system-card.pdf[2]

Reference

Claude 3.7 Sonnet and Claude Code: https://www.anthropic.com/news/claude-3-7-sonnet

claude-3-7-sonnet-system-card.pdf: https://assets.anthropic.com/m/785e231869ea8b3b/original/claude-3-7-sonnet-system-card.pdf