文:王智远| ID:Z201440

文:王智远 | ID:Z201440
打开网易新闻 查看精彩图片
文:王智远 | ID:Z201440

豆包2.0发了,该刷的都刷到了。参数、跑分、多模态升级,该看的都看了,刷完有个感觉,有些东西可以单独拎出来聊。

先说价格。百万tokens输入,Lite版0.6元。0.6元是什么概念?得放在一块比。

GPT-5.2标准版,输入1.75美元/百万tokens。按现在汇率,折人民币12.6元。Gemini 3 Pro,输入2美元/百万tokens,折人民币14.4元。

豆包的0.6元,不到它们的二十分之一。

官方说法更直接,推理成本跟行业内顶尖模型降低约一个数量级。一个数量级,就是十分之一。

这是战略定价。

字节在干一件事,把Token价格打到地板,逼所有人重新算账。自己招人搭模型划算,还是直接调用API划算?答案不用我说。

再看内部。Lite版0.6元,Pro版3.2元。

差五倍多,但Lite不是阉割版。官方说它的综合性能超越两个月前发布的上一代主力模型豆包1.8。

拿主力级模型打价格战,和其他厂商拿入门产品降价,不是一个打法。便宜。便宜到可以浪费。浪费才会产生新场景。新场景才会沉淀新数据。

所以,豆包2.0真正的对手是谁?是开发者心里的那个念头:要不我自己搭一个?

0.6元这个数,是算准了你心里的账。字节想把「自己搭模型」这个选项,从你的选择题里删掉。

便宜是便宜,这东西到底能干什么?这得看另一个细节:视频理解。

豆包2.0有个指标叫EgoTempo。这词有点绕,翻译一下:模型能看懂人的动作、节奏、微表情。在这个指标上,豆包的分数超过了人类平均水平。

超过人类是什么概念?

以前AI看你,是照片。现在AI看你,是直播。你挥一下高尔夫球杆,它能说出你第几秒手腕角度不对。你做一个健身动作,它能实时纠正你膝盖有没有超脚尖。

字节把Seedance 2.0也发了,那是做视频生成的。加上豆包2.0的视频理解能力,一套组合拳:看得懂,还能生成。

把这个能力放到抖音里想想。

现在的推荐是你刷了什么、搜了什么、停留了多久,算法猜你喜欢什么。以后的推荐,是你今天穿什么衣服、做什么动作、情绪怎么样、接下来想干嘛,AI实时看着你,然后给你推东西。

这是从「猜」升级到「看」。

OpenAI做视频理解,方向是让AI看懂世界;Google Gemini做视频理解,方向是空间定位和物理世界感知。字节做视频理解,方向只有一个:让AI看懂「你」。

那为什么要做这个方向呢?因为抖音、剪映。因为字节手里有全球最大的用户视频数据池,字节刚好匹配场景刚需。

另外,有一个细节值得琢磨。

豆包2.0在多模态基准测试里,TVBench、MotionBench这些和运动、时序相关的指标,都跑在前面,说明字节强化的是「这段视频里发生了什么变化」。

变化才是关键。

你刷抖音,看的不是静止的照片,是动的、活的、有节奏的内容。AI要能看懂这个,才能真的帮上忙。

所以我的第二个感受,字节在做的事,是把AI从「问答机器人」变成「盯着你看的私教」;盯着你看还能给出建议,这事得有场景才做得到。

能看懂人,然后呢?能干活的AI长什么样?

这就得聊Agent了。豆包2.0发的不只模型,还有Code版,专做编程的那个版本,字节的AI编程工具。

我记得有个演示,5轮对话,搭一个「马年庙会」互动页面。11个NPC,性格各不相同,会聊天、会招呼顾客、会现场砍价;烟花升空时的祝福语,孔明灯上的题词,都是AI即时生成的。

每次进去,互动都不一样。

以前这事需要一个团队:产品经理画原型、程序员写代码、美术画图、测试跑流程,几周时间;现在一个人加一个AI,几分钟。

字节把这个项目的代码和素材都开源了,放在GitHub上,让开发者自己去试,这是在展示一件事:能干活的AI来了。

能干活的AI意味着什么?企业组织架构要变。

再看另一个案例。飞书上搭了一个智能客服Agent,用OpenClaw框架加豆包2.0 Pro。

这个客服能干的事,跟客户对话、回答问题。遇到自己解决不了的难题,它会主动拉群,把真人同事拽进来。

帮客户预约上门维修,修完了还主动回访,顺手推荐春节优惠产品。一套完整的服务流程,AI自己跑下来了。

另外,这里有个指标值得看:HLE-Text,叫「人类的最后考试」。豆包2.0 Pro在这个测试里拿了54.2分,大幅领先其他模型。

54.2分意味着什么?

在一些复杂任务上,AI的表现已经接近人类专家的门槛了,智谱的GLM-5强调开源第一,DeepSeek V4被曝编程能力超Claude,字节的差异化在哪儿?

在全流程。

智谱让你自己搭模型,DeepSeek让你看代码生成指标,字节给你一套「工具加模型」的组合拳,TRAE加豆包Code。从想法到可运行的应用,几步就走完了。

所以,这在卖「生产力」。中台还要不要?PM和开发的边界在哪?哪些岗位会被AI替掉?字节没明说。但给了一个样板间,你自己看,自己琢磨。

能干活的AI来了。它的第一个活儿,可能替掉一些岗位。

所以,把这些事串起来,我有个判断;以前AI竞赛,比谁家模型强,参数、跑分、多模态,都是赛道上的指标,现在字节换了个玩法。

比谁门槛低、比谁看得懂你、比谁能替人干活。这叫什么?这叫重新画起跑线,它换了一条赛道,让你跑。剩下的,就看别人怎么跟了。

打开网易新闻 查看精彩图片