春节之前,字节的年度大招批量放出。

在 Seedance 2.0 刷屏之后,2月14日,字节官宣豆包大模型 2.0(Doubao-Seed-2.0)发布。这次发布的模型具体包括 Pro、Lite、Mini 三款通用 Agent 模型,和一个 Code 模型(Doubao-Seed-2.0-Code)。

整体来说,这个系列围绕大规模生产环境下的使用需求做了系统性优化,提升多模态理解、复杂指令执行及长程任务处理能力。Seed-2.0-Code 模型,则是基于 2.0 基座模型,针对编程场景进行优化的版本,重点强化前端语义理解等能力。

打开网易新闻 查看精彩图片

在这个系列模型发布的同时,我发现扣子编程也接入了 Seed-2.0-Code 模型。

上个月,我在扣子上手搓 Skill 的体验很丝滑。所以这次,我直接在扣子编程上玩了一遍 Seed-2.0-Code 模型。

视觉理解Coding,复刻网页前端

登录扣子,点开扣子编程,就能在模型列表里选择 Doubao-Seed-2.0-Code。

打开网易新闻 查看精彩图片

我先试了一个最近经常测的任务:要求 Seed-2.0-Code 生成一个能可视化展示交通信号灯工作原理的案例。这个需求虽然听起来不难,但强考验模型的逻辑推理能力、时间序列理解和空间理解能力。

输入Prompt,我看到扣子里的模型在拆分需求—持续思考—执行命令。没过几分钟,代码生成完毕,预览里出现了一个包含完整交通信号灯系统、车辆模拟系统以及控制面板的页面。

坦白说,这个元素风格我没具体提要求,略有点糙,但系统设计还挺全面。最重要的是,我专门检查了页面中的车辆出现数量、信号灯状态和控制面板中的统计是否一致,都没有发现问题,逻辑挺到位。

打开网易新闻 查看精彩图片

完成第一个测试后,我准备做一个更细致的网页。

刚好在字节发布的 Seed2.0 模型介绍里,我看到 Seed 团队提到一个“典型失衡”的问题。

他们认为,语言模型已经可以顺利解决竞赛难题,但放在真实世界中,它们依然很难端到端地完成实际任务,比如一次性构建一个设计精良、功能完整的小程序。

要不,就用这个 Code 模型整一个符合实际需求的前端吧。

我的具体要求是:在扣子编程里制作一个生活类内容平台,复刻现在流行的平台风格。

为测试新模型的多模态理解,我特地在编程页面里上传了参考图。参考图不只一张,除了网页风格的参考图,我还传了用于展示用户头像的图。

这里我玩了个花活,专门去豆包 App 用最新的春节模版生成了一堆马年头像,让模型制作时把它们当作网页的用户头像。

打开网易新闻 查看精彩图片

输入需求,一键发车。

打开网易新闻 查看精彩图片

过了几分钟,预览里直接展示出网页。能看到,它的结构、UI风格的复刻、瀑布流的实现都比较完整,我上传的用户头像图,也被严丝合缝地贴进了头像框。

打开网易新闻 查看精彩图片

我接着在这个任务里优化,又上传了一堆豆包生成的图文帖封面图,要求模型把它们贴进帖子首页,再把每个用户的名字改得更符合帖子内容。

打开网易新闻 查看精彩图片

很快成品出来了。网页里,我上传的封面图、帖子内容和用户名完全 Match。有点啊。

打开网易新闻 查看精彩图片

这个整体只用了10分钟搓出来的网页,虽然还能继续优化,但用来当一个用来测试或展示的 Demo 完全没问题。

打开网易新闻 查看精彩图片

手搓发票读取工作流

这次 Seed2.0 还重点强调对企业体验的优化。于是,我又整了B端需求的测试。

想了想,现在很多中小型公司发票管理很头疼,经常只能人工做发票信息的搬运和整理。

刚好处理非结构化信息也是这次 Seed 团队提到的企业级强需求,那么,就用扣子编程 + Seed-2.0-Code 搓一个能直接部署上线的 PDF 发票识别和整理功能。

我设想这个发票管理一共有4个步骤:

1️⃣:用户上传多个发票 PDF 文件

2️⃣:AI 提取做开票日期、收付款方、发票金额这些关键信息

3️⃣:自动给这张发票打上类似“餐饮”、“出行”等等标签

4️⃣:把提取出的信息都放在一个 Excel 文件里

这是一个典型的工作流场景。我在扣子首页选择创建一个“工作流”,用的提示词也比较简单。

打开网易新闻 查看精彩图片

过了3分钟,它做好了。

打开网易新闻 查看精彩图片

这次我一直在围观模型干活儿,看到它自己去找了不少资料。

比如让 AI 用发票里的信息给费用打标这个步骤,需要用到大模型。我看到它自己去查了怎么在代码里调用大模型,需要什么组件。

打开网易新闻 查看精彩图片

完成之后,我随便找了张发票发给这个工作流。没想到,它几秒就完成了任务,不但信息解析正确,还给这张加油发票打上了“出行”标签。

但我也发现了问题,工作流创建的 Excel 文件在一个临时文件夹里。我在项目的文件目录里看不到这个文件夹,这样会让用户找不到生成的 Excel。

打开网易新闻 查看精彩图片

我让它把 Excel 放到一个指定的文件夹里,也得给我支持批量上传的功能。改完我又试了试,体验丝滑了不少。而且,这个修改过程我也没和扣子废话,基本属于无痛调整了。

最终版整理好的 Excel 长这样,发票信息都完成了结构化处理。

打开网易新闻 查看精彩图片

测到这里,我的初次尝试就差不多了。整体就我在扣子上用完 Seed-2.0-Code 的感受来说,虽然一些更复杂的需求还能做得更好,但基于视觉理解的Coding,和扣子优化后的 Coding 体验都让人更好上手。

这也很像扣子的一贯风格。就拿今年来说,除了能用最新的 Code 模型,像手搓 Skill、部署 OpenClaw 这种刚需,它也都做了开发者友好的优化。

我看了下自己上个月在扣子手搓的 Skill,已经有 3000 多人用过。

打开网易新闻 查看精彩图片

*我的Skill链接:

https://www.coze.cn/?skill_share_pid=7596158520421122100

通过扣子创建的 OpenClaw,还能支持直接导入在扣子做好的 skill。

打开网易新闻 查看精彩图片

感觉大家也可以在扣子上多蹲新功能~