文:王智远 | ID:Z201440
打开网易新闻 查看精彩图片
文:王智远 | ID:Z201440

大早上打开我的ChatGPT苹果端,发现推送了新模型。

名字叫:GPT-4o with canvas。

下面还有一段文字:“在写作和代码方面开展协作(测试版)”;看它字面表述意思可能是,主攻写作、代码两个方面。

我特别好奇它都能做些什么,就试着问了它:GPT-4o with canvas是什么东西?

它告诉我,这是OpenAI推出的一个新功能。这个功能结合了GPT-4的对话能力和一个叫做“画布”的灵活工作区,可以让你在内容创作和代码开发上有更好的体验。

然后,还介绍了GPT-4 with Canvas的一些核心特点。

比如:

你可以在画布上整理你的内容,无论是长篇文章还是复杂的编程任务;你还可以把代码片段、段落、图表等不同类型的内容组织在一个页面上,这样更容易理解和编辑。

你还可以在画布上随意拖拽文本、重新排列、直接修改,而且还加入了协作功能。这对于既要写文档又要编程的人来说,就不用来回切换了。

简单来说,这个功能给用户提供了一个可视化的地方,让大家可以更方便地管理和修改AI生成的内容。

看到这,我是激动的,而且非常激动。知道为什么吗?

因为在8月20日,我曾经吐槽过AI搜索,还写了篇文章《AI搜索要卷什么?》里面我提到一个观点:

AI搜索要改变交互方式。从功能性来说,大家都在做,比如365搜索、秘塔搜索,它们在搜索完后,会整合相关的工具。

但实用性还有待提高。

以前我们用传统搜索引擎,要解决一个问题可能得分成A、B、C三部分,然后一个个输进搜索框;搜索引擎用爬虫在网上抓信息,然后自己按逻辑排个序,列出结果。

我们再拿这些信息自己分析、总结,最后才能用来支持决策。

现在有了AI搜索产品,一切变简单了。你只要提出问题,AI就能直接理解你的意图,拆解问题,并找到相关网页,然后,大模型会分析信息,直接整理成结构化的结果给你。

但问题是,仅仅列出A、B、C还不够。我们希望在信息列出后,还能用工具进一步分析,然后总结,最后生成报告。这才是关键。

这个过程像建筑房子:

先画草图(提出问题并拆解),然后找材料(收集和分析信息),最后精挑细选材料(确保每一步都精准),这样才能建成又坚固又好看的房子。

问题就在这。AI没有给用户选择材料的权利,也没有提供足够的工具。

现在GPT-4o with canvas解决了。它让用户搜索完内容后,可以在一个可视化面板上操作。这意味着:你生成的内容会出现在一个页面上,你可以自由地排列和组装,如果不喜欢某个结果,还可以自己动手改。

所以,之前我还抱怨AI搜索走错了方向,国内一直没有好的解决方法,没想到还是AI圈的老大搞定了。

我还特意问了问,这个GPT-4 with Canvas功能在哪能试一试?

它告诉我,如果你是ChatGPT Plus会员,可能会在使用ChatGPT的界面中看到一个叫“Canvas”的选项;不过,只有部分人有机会测试这个功能。看来,看来作为每个月给ChatGPT充值的人的确拿到了福利。

我很好奇,到底怎么体验?

最后摸索了半天,发现有三步:一,找到名为“GPT-4o with canvas”的模型,然后勾选它;二,进入对话框,输入一些特定的指令;三,用这些指令就能激活canvas,在上面编辑内容了。

图:GPT-4o with canvas模型选择到唤起方式
打开网易新闻 查看精彩图片
图:GPT-4o with canvas模型选择到唤起方式

要注意,输入的内容必须符合要求,如果你在体验时不够具体,它是无法启动的。

比如,如果我只是说:我是王智远,想写篇关于“GPT-4o with canvas”的文章,这样说太笼统了,细节不够,它就无法响应。

但如果你说,我要写一篇突出“GPT-4o with canvas”在技术方面的不同,它就可以调动出来了。所以,你给的指令一定要清楚明确。整体出来的页面如下:

图:GPT-4o with canvas整个页面布局
打开网易新闻 查看精彩图片
图:GPT-4o with canvas整个页面布局

左边布局是“问题框”,指令调动的地方;右边的布局是面看板,俗称“canvas”。

右下角有五个图标,从下往上分别是:添加表情符号(Add emojis)、最后阶段完善(Add final polish)、阅读水平(Reading level)、调整长度(Adjust the length)和建议编辑(Suggest edits),这些是它的关键功能。

我来分别体验一下,感觉挺新鲜。

先说说表情包。只要点一下,就能自动在文章里加各种表情。就好比你在小红书上写东西,排版不行,扔给它,它马上就能整理好。

再来看看调整长度的功能。这个可以帮你整理文章的结构,比如:把文章分成主题、标题、段落等不同部分。

那么,Reading level这个功能是干嘛的呢?

它可以控制页面显示的大小。你往上滑,页面就会变大;往下滑,页面就缩小。这和我们平时浏览网页时放大、缩小看内容是一个道理。

最后是Suggest edits。这个功能,就像是帮你纠正文章逻辑的小助手。比如它觉得我这句话太长了,就会建议我把长句子改短,或者在某个理论下面加个例子,让内容更易懂。

图:GPT-4o with canvas,Suggest edits演示
打开网易新闻 查看精彩图片
图:GPT-4o with canvas,Suggest edits演示

整体体验下来,我有两个感受:

第一,GPT-4o with canvas提供了一个全新的页面。这个页面被组织得更有条理,还加入了提示词;这意味着,如果你能好好利用提示词,就能更自由地创造你想要的内容。

第二,这是一个巨大的进步,它解决了AI生成内容中的“过程性”问题。这意味着,以后如果AI生成了你不想要的内容,你也不用再担心替换不掉了。

比如说:

我要写一篇报告。在用AI帮我写初稿时,会有些部分我觉得不合适,或者不需要;以前,如果AI写的内容有不对的地方,不能改。

现在,有了canvas功能,我直接可以轻松修改,或者完全替换掉不想要的内容,让整个文档更符合我的要求,这样一来,我就可以更自由地控制最终的报告内容。

因此,通过这一个功能的更新,它颠覆的不仅是AI搜索、还包括内容编辑、个性化定制。

这就意味着,我不仅能更准确地找到我需要的信息,还能根据我的喜好调整生成的文本,这种能力应用到不同场合,会让AI工具变得更灵活,更有用。

期待国内AI生成类产品能够跟上。可是,问题来了:

国内会在哪个环节加入画布(canvas)功能呢?如果这个问题能解决,我相信AI搜索产品的商业化会更加多样。

想想看,如果我们在需要的时候能自由地添加、修改内容,甚至在过程中调用一些工具功能,这会怎样激发我们的创造力呢?又会怎样收费?

我想起了Perplexity的创始人说过的话:搜索的本质是一个答案引擎;它的目的是帮助人们发现新东西,并引导他们向正确的方向前进。

也就是说,从搜索结束后,就能让用户拖拽、编辑,那真的太有想象空间了(这句是我说的)。

因此,GPT-4o with canvas会改变AI搜索吗?AI的剧情还在不断推进,等到国庆过后,它又将掀起一场什么样的产品革命?

真的太有意思,太期待了。