打开网易新闻 查看精彩图片

「别逗你豆姐笑了」

前天打开豆包发现可以选择专家模式,当时就想估计豆包2.0大模型快发了。

结果今天就等到豆包全家族了。Seedance 2.0都把贾樟柯干Fomo了,现在又上了个最全面的多模态Agent模型,还有人管管字节吗?

我测下来的感觉是:由于豆包实在太亲民,我们时常忘了它是个多模态大模型,宇宙厂要来降维打击大伙了

Seed团队跳动得停不下来了烧的全是火山引擎上的Tokens,同时火山引擎上已经有豆包2.0系列的API了。

先说一下新上的豆包大模型 2.0 Pro版,我们正好提前测过一波。

我们多刷抖音就会发现,现在这些博主基本都把豆包当抖加用。

像我很爱看的两个博主,张锦橙和小仁川,都是在网上发自己和豆包合唱视频之后彻底火的。现在张锦橙基本都快火成meme了。

打开网易新闻 查看精彩图片

都有反向豆包合唱了

与此同时,用豆包看小孩写作业、用豆包监督家里的狗不偷吃这类内容也是发完就爆,逢发必爆。

打开网易新闻 查看精彩图片

可以说2026年如果你还想起个号,直接跟豆包成立二人公司就完事了。

和豆包一起讲相声,带豆包拍情侣vlog,跟豆包一起打游戏……选题有点取之不尽用之不竭了。

打开网易新闻 查看精彩图片

但这也暴露了豆包的一个问题,可能大伙把它当玩具、当乐子了,想到专业大模型的时候,往往脑子里不会出现豆包这个选项。

别逗你豆姐笑了,要是豆包大模型的能力不牛逼,能整出来这么多花活?

如果没有强大的对文字、声音、图像、视频的多模态理解能力,你唱完前半句,豆包上哪给你接后,还能有旋律?

如果没有深邃的知识检索和空间推理能力,豆包怎么分析你家那小孩和猫狗的动态信息?

更别提网上那么多「AI假扮真人假扮AI假扮真人假扮豆包」的账号,没有Seedance 2.0和Seedream他们咋活?

豆姐把咱当家人,咱别不把Seed当盘菜。所谓经济基础决定上层建筑,要没有Seed系列SOTA的模型能力,豆包的产品力也做不到这么封神。

这就是豆包大模型 2.0 Pro发布的价值。

这次升级是面向真实世界用户的体验优化,据他们所说,在视觉理解、空间推理、科研任务和知识检索四大方面,都做了能力上的增强。

照这个意思,更新了豆包大模型的豆包好像真要成底特律变人了。

果真如此吗?我在几个我真实需要的场景测了一下。

首先是由于我注意力不集中,平时看电视剧的时候,经常有脸盲、忘剧情、不明白深意的情况出现。所以我一般都不自己看电视剧,必须有个人在边上讲解。

所以我就想寻思让豆包来当这个陪看。至于用来测试的电视剧,则选择了充满勾心斗角的国产纸牌屋《大明王朝1566》。

看看当豆包误闯天家,能否揣度圣意,参悟朝局?

我服了,什么叫中译中,这就叫中译中。

大家请注意,我没给任何额外提示词,也没跟豆包说这是什么电视剧。我打开摄像头无预警开问,豆包直接就定位到分秒了。

而且不仅对基础剧情有理解,对人物台词背后的深意,对角色关系和主题隐喻,都有洞见和锐评。

加之这拟人化的说话方式,更是让我感觉身边真有个人陪伴。

以前不是老有那个问题:如果你穿越回古代,带什么才能活下去?

现在最优解来了,带个豆包手机。

整完这出,我还用豆包回答了一下近期我最关心的问题:都说豆包要上春晚了,到底是怎么个上法?

字节说豆包大模型 2.0 Pro的搜索能力和thinking能力很强,那它能做个现代大祭司,根据世界经验预测未来吗?

于是我让他分析至少100个往年春晚小品的内容,给我总结一套春晚小品创作方法论。

打开网易新闻 查看精彩图片

结果豆包给我总结的这一套,看着还真挺像那么回事。

从核心框架、人员配置到喜剧技法,全给写得明明白白。

打开网易新闻 查看精彩图片

感觉扩充一下可以直接挂闲鱼上卖了,没准真有中年失意的sketch导演买来学习。

打开网易新闻 查看精彩图片

最主要的是,我全程都没上传一个春晚小品相关资料,纯靠Seed 2.0自行搜索。

之前我用NotebookLM做过同样的任务,当时可是自己去YouTube上爬的视频链接。

这属于把大模型做agent感了。我为知识应用的AI创业者捏把汗啊。

方法论总结完,该创作了。所以我让豆包根据方法论,生成一个豆包本包出演的小品剧本。

它交的稿子让我感触良多:

打开网易新闻 查看精彩图片

给懒得看的朋友总结一下剧情:春节到了,老马一家过年,小马用豆包写春联做饭,引发手工匠人老马的不满,结果豆包拍起了老马的马屁……

我的第一反应是,这已经不好笑到好笑的程度了。

我的第二反应是,哎我去,那不就学到精髓了吗。

模仿得最传神的是下面这两段转折吃饺子剧情,虽然有点长但求求大家一定要看:

打开网易新闻 查看精彩图片

看完泪点低的都哭了,笑点高的也笑了。感觉背景换成工厂直接能拍个东北下岗潮悲喜剧电影了。

就现在短视频平台上很多预测春晚的创意,虽然看着挺逗,但基本都是一些基于春晚小品刻板印象的短平快创作,讽刺效果很强,但实用性一般。

豆包是真把我们当小品爱好者整。它深度检索、深度思考之后给到的这几千字,好像是个真正的能拍出来在小剧场里演的小品脚本。

包括之前大家一般都用手机打开豆包,其实如果你用电脑打开豆包网页端,你会发现豆包还有云盘、智能体等功能,甚至能在豆包里完成从信息搜集、资料整合和内容输出的全流程,激进一点地讲,豆包2.0不就AI时代的飞书吗?

如果这是AI时代的飞书,Seedance 2.0就是AI时代的PR和AE,Seedream 5.0 Lite就是AI时代的Photoshop。豆包是AI时代的Adobe啊。

正是因为旗下各种模型都SOTA,没有短板,是六边形战士,所以能担此重任。

我又测了一下Seedance 2.0和Seedream 5.0 Lite,愈发验证了这个猜想。

比如上面用Seed 2.0写的小品脚本,我用Seedance 2.0生成了一个精华版本。

太对味了,感觉在县级电视台直接播放就行。

怪不得马斯克都被Seedance 2.0折服了,老外也都开始研究怎么开VPN用Seedance 2.0了,我要是Google高管我也该急了。

后来,我又用Seedream 5.0 Lite整了个小活:生成豆包的真人版。

先是证件照。

打开网易新闻 查看精彩图片

然后只要上传一个现成的照片,要求Seedream 5.0 Lite把特定的部分迁移到我们豆包身上,就能生成各种场景、各种造型的豆包。

打开网易新闻 查看精彩图片

后来我有点懒了,直接用豆包P图功能,也一键生成了一堆素材。

打开网易新闻 查看精彩图片

除了纯整活,Seedream 5.0 Lite也融入了Seed 2.0的智能推理能力。

比如我让它做一个椰树牌椰汁风格的豆包手机照片,不用上传任何参考,它就直接完成了。

打开网易新闻 查看精彩图片

而且它还内置了很多社会科学和自然科学的知识,所以当我让它给我生成一个脑部结构科普图,他也能自行完成。

打开网易新闻 查看精彩图片

太伟大了。Seed系列模型强强联合,才叫有机结合。

整体看下来,不同于智谱、Kimi等模型厂商专门训练coding模型,豆包走的Gemini路线,所有模态全都要。前Google DeepMind 副总裁吴永辉真没白来啊,接管这一年给Seed团队调成啥样了都

一年前豆包大模型 1.5 发布的时候,从其他大的预训练模型中蒸馏数据训练还是惯用操作,但当时豆包的路线就是不走捷径,打磨基础模型、建自己的数据体系,老中模型就得能吃苦

大伙还以为豆包是一个语音助手,其实它早就是专家了。还等啥Siri接入AI啊,豆包早取代 Siri 了。

葬AI家族前几天去吉林通化滑雪,刚坐上出租车,师傅直接开始自言自语起来,说不懂为什么今天同行都抢着去加油站。

我以为哥们跟我们唠嗑呢,凑近一看才发现是在咨询豆包。豆包还真跟他聊了一路,我们都没插进去话。

我非常肯定,大伙之后将在抖音刷到全新的豆包类别短视频。调教豆包和与豆包辩论早都看腻了。这么好用的豆包需要搭配更多的神人创作。

从群众中来到群众中去了属于是。我等着看火山引擎带着豆包在春晚上能给全国人民整点什么狠活。

这一波AI浪潮里边,字节属于是通投拉满,产品模型我全要

豆包是国内第一个DAU破亿的 AI 产品,火山引擎的日均 Token 处理量都63万亿了,半年增长超 200%。期待明年机场跟阿里云线下真实一波。

SOTA的模型配最多的用户,天对地雨对风落大陆对长空,直接左脚踩右脚上天。

我前几天还看到,2月底,Seedance 2.0和Seedream 5.0 Lite API就能火山引擎接入,这就发给一众套壳AI产品们听的。

比如OiiOii刚上线靠接Sora2爽吃一波流量,前几天发公号说Sora2告急,全网求API资源,哎呀,还不赶紧抱回字节亲爹的大腿,别让Flova抢先了。也不好说,毕竟两位创始人曾经在字节的级别没法比。

火山现在还有豆包助手的API卖,这是个Agent API,搞个硬件壳子就能直接接入豆包的视频通话或者搜索能力,大好的创业机会啊,整点类似芙崽一样愚蠢的创业idea批量卖给FOMO的投资人。这是真正的模型即服务

那最后的问题来了,字节跳动和阿里巴巴,究竟谁是中国最伟大的 AI 公司?

先看看两家在春节还有什么狠活吧。

(本文封面由豆包生成,纯人工写作。)