点击下方“JavaEdge”,选择“设为星标”

第一时间关注技术干货!

免责声明~ 任何文章不要过度深思! 万事万物都经不起审视,因为世上没有同样的成长环境,也没有同样的认知水平,更「没有适用于所有人的解决方案」; 不要急着评判文章列出的观点,只需代入其中,适度审视一番自己即可,能「跳脱出来从外人的角度看看现在的自己处在什么样的阶段」才不为俗人。 怎么想、怎么做,全在乎自己「不断实践中寻找适合自己的大道」

0 前言

对标 Claude 的Artifacts。

与 ChatGPT 一起写作和编程的新方式: 图片展示了一款垂直工具栏,包含五个按列排列的图标,背景为柔和的粉彩色调。顶部起第三个图标是一本打开的书,其旁边有标签标注为“阅读等级”。

打开网易新闻 查看精彩图片

我们推出了 Canvas,这是一个用于写作和编程项目的新界面,能够超越简单的聊天功能。Canvas 会在单独的窗口中打开,允许您与 ChatGPT 合作完成项目。这款早期测试版引入了一种新型协作方式——不仅通过对话,还可以并肩创建和完善想法。

Canvas 基于 GPT-4o 构建,用户可在测试阶段通过模型选择器手动选择。从今天开始,我们将向 ChatGPT Plus 和团队用户全球推出 Canvas。企业和教育用户将在下周获得访问权限。我们还计划在测试版结束后向所有 ChatGPT 免费用户开放 Canvas。

1 与 ChatGPT 更好协作

每天都有用户利用 ChatGPT 帮助完成writing和编程任务。虽然聊天界面操作简便,适合许多任务,但在需要编辑和修订的项目中,它有所局限。Canvas 为这类工作提供了全新界面。

借助 Canvas,ChatGPT 能更好地理解您试图完成的任务的上下文。您可以高亮特定部分,明确告诉 ChatGPT 需要关注的内容。像一名文案编辑或代码审阅者一样,它可以根据整个项目提供内联反馈和建议。

在 Canvas 中,您掌控项目。您可以直接编辑文本或代码,并通过快捷菜单要求 ChatGPT 调整写作长度、调试代码,以及快速执行其他有用操作。您还可以通过 Canvas 的后退按钮恢复您工作的先前版本。

当 ChatGPT 检测到 Canvas 能发挥作用的场景时,会自动打开 Canvas。您也可以在提示中加入“使用 Canvas”来启动该功能,并将其用于现有项目。

写作快捷方式包括:

  • 建议编辑:ChatGPT 提供内联建议和反馈

  • 调整长度:将文档长度调整为更短或更长

  • 改变阅读等级:调整阅读等级,从幼儿园到研究生水平

  • 添加最终润色:检查语法、清晰度和一致性

  • 添加表情符号:添加相关表情符号以增强效果和丰富色彩

2 在 Canvas 中编程

编程是一个迭代的过程,在聊天中很难跟踪代码的所有修订。Canvas 使您更容易理解和跟踪 ChatGPT 的修改,我们计划继续提升这些编辑的透明度。

编程快捷方式包括:

  • 代码审查:ChatGPT 提供内联建议以改进代码

  • 添加日志:插入打印语句,帮助调试和理解代码

  • 添加注释:为代码添加注释,使其更易于理解

  • 修复错误:检测并重写有问题的代码以解决错误

  • 移植到其他语言:将代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP

3 训练模型成为协作者

我们训练了 GPT-4o,使其能够作为创意合作伙伴进行协作。模型能够判断何时打开 Canvas、进行针对性编辑或完全重写。此外,它还理解更广泛的上下文,提供精确的反馈和建议。

为此,我们的研究团队开发了以下核心行为:

  • 针对写作和编程任务触发 Canvas

  • 生成多样化的内容类型

  • 进行针对性编辑

  • 重写文档

  • 提供内联批注

我们通过 20 多项自动化内部评估测量了进展。我们采用新颖的合成数据生成技术,例如从 OpenAI o1-preview 中提取输出以对模型进行核心行为的后期训练。这种方法使我们能够快速改进写作质量和用户交互,而无需依赖人工生成数据。

一个关键挑战是定义何时触发 Canvas。我们教模型在接收到诸如“撰写关于咖啡豆历史的博客文章”这样的提示时触发 Canvas,同时避免对诸如“帮我做一道新菜”这样的常规问答任务过度触发。对于写作任务,我们优先改善“正确触发”(以牺牲“正确不触发”为代价),达到了 83%,相比零样本的 GPT-4o 基线有显著提升。

需要注意的是,此类基线的质量高度依赖于具体使用的提示词。在不同提示下,基线可能表现得很差,但以不同的方式——例如,在编程和写作任务中均匀不准确,从而导致不同的错误分布和其他形式的次优表现。对于编程任务,我们故意对触发进行偏置以避免干扰高级用户。我们将根据用户反馈持续优化这一点。

打开网易新闻 查看精彩图片

对于写作和编程任务,我们改进了 Canvas 决策边界的正确触发率,在写作和编程任务中分别达到 83% 和 94%,相比基线零样本的 GPT-4o 有明显提升。

第二个挑战是调整模型在触发 Canvas 后的编辑行为——具体来说,决定是进行针对性编辑还是完全重写。当用户通过界面明确选择文本时,我们训练模型执行针对性编辑,否则倾向于重写。随着模型优化,这种行为还将继续改进。

打开网易新闻 查看精彩图片

在写作和编程任务中,我们优先提升 Canvas 的针对性编辑能力。带有 Canvas 的 GPT-4o 在这一能力上的表现比基线提升 18%。

最后,训练模型生成高质量评论需要精细迭代。与前两种情况不同,这种能力难以通过自动化方法评估,因此我们依赖人工评估评论的质量和准确性。结果显示,我们的 Canvas 集成模型在准确性上比零样本 GPT-4o 提升 30%,在质量上提升 16%。这表明,通过合成训练,可以显著改善响应质量和行为,效果优于使用详细指令的零样本提示。

打开网易新闻 查看精彩图片

人工评估显示,Canvas 模型在评论的准确性上提升 30%,在质量上提升 16%,显著优于基线 GPT-4o。

4 展望

让 AI 更有用、更易于访问需要重新思考与 AI 的交互方式。Canvas 是一种全新的尝试,也是 ChatGPT 自两年前发布以来首次对视觉界面进行重大更新。

5 12月12日重要更新

  • Canvas 向所有用户开放并内置到主要模型中,无需额外操作即可使用

  • Canvas 现支持直接运行 Python 程序代码,可直接看到代码生成的文字或图形结果。

  • Canvas 内置到自定义 GPT 中,使其具备 Canvas 的强大功能。

6 咋用?

12月12日起,Canvas 直接内置到 GPT-4o ,用户无需再通过模型选择器切换到带有 Canvas 的 GPT-4o。某些提示或粘贴的文字,Canvas 会自动打开。目前,这功能仅支持 ChatGPT web。

Canvas 能帮助用户将一个创意扩展成完整的作品。ChatGPT 界面发现输入区域有一个新按钮,可查看所有可用工具,其中包括「Canvas」。

7 功能盘点
打开网易新闻 查看精彩图片
7 功能盘点

虽然叫 Canvas,但主要是写作及代码工具,编辑长篇或复杂内容。适用场景:

  • 撰写长篇文章或文件:编写技术博客、SOP或完整故事

  • 代码编辑:Canvas 可编辑代码片段,如 Python 脚本、HTML 网页或其他语言,并支持多种语言的格式化

  • 多次修改与反复调整:需反复修改内容、重组段落或进行深入校对时,Canvas 让细节调整更方便

  • 团队协作草稿:与他人分享或共同编辑内容,Canvas 是条理清晰的平台。

示例:利用 Canvas 创作故事

在 Canvas 中创建一个故事,如:「为高级软件工程师写一个关于如何进阶为技术专家的故事」。

打开网易新闻 查看精彩图片

生成后,可在段落的右下角的「编辑建议」按钮中进一步调整:

打开网易新闻 查看精彩图片

如修改文章长度、润色程度和阅读等级。调整后,内容会根据目标变化:

8 支持运行 Python 程序代码
打开网易新闻 查看精彩图片
8 支持运行 Python 程序代码

此次更新还使 Canvas 支持运行 Python 代码,用户可以直接在 Canvas 中运行代码,无需手动转移到本地系统验证。

Canvas 可用于以下任务:

  • 审核代码

  • 转换代码语言

  • 修复 Bug

  • 添加日志与注释

更重要的是,Canvas 提供了一个内置的 WebAssembly Python 模拟器,几乎可加载任意 Python 库并即时运行程序代码。

9 自定义 GPT 的内置 Canvas 功能

对于自定义 GPT 用户,Canvas 将默认内置,用户可通过设置调整何时或是否启用 Canvas 功能。自定义 GPT 的强大功能与基础版 ChatGPT 同步,同时支持更定制化的功能满足用户需求。

关注我,紧跟本系列专栏文章,咱们下篇再续!

★ 作者简介:魔都架构师,多家大厂后端一线研发经验,在分布式系统设计、数据平台架构和AI应用开发等领域都有丰富实践经验。 各大技术社区头部专家博主。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。 负责: 中央/分销预订系统性能优化 活动&券等营销中台建设 交易平台及数据中台等架构和开发设计 车联网核心平台-物联网连接平台、大数据平台架构设计及优化 LLM Agent应用开发 区块链应用开发 大数据开发挖掘经验 推荐系统项目 目前主攻市级软件项目设计、构建服务全社会的应用系统。 ”

参考:

  • 编程严选网

编程严选网:http://www.javaedge.cn/ 专注分享软件开发全生态相关技术文章、视频教程资源、热点资讯等,全站资源免费学习,快来看看吧~ 【编程严选】星球

欢迎长按图片加好友,我会第一时间和你分享软件行业趋势面试资源学习方法等等。

添加好友备注【技术群交流】拉你进技术交流群

关注公众号后,在后台私信:

  • 更多教程资源应有尽有,欢迎关注并加技术交流群,慢慢获取

  • 为避免大量资源被收藏白嫖而浪费各自精力,以上资源领取分别需要收取1元门槛费!