最近一期AI碰撞局(10.17)是澜码的周健、阿朱、侯宏老师一起谈AI智能体在企业中的落地问题,碰撞的时候一个核心问题是:
为什么AI驱动的企业级产品不会重蹈过去SaaS的覆辙?商业模式、技术应用到底哪里出现了什么样的变化?参见:
活动的小记稍后会发,大家可以看下现场的情况,我这里换个视角说下这问题。
最近OpenAI 发了个开源的项目叫Swarm,在Github上迅速突破1万星。但其实这是个很小的项目,也肯定不实用,纯粹概念性,好处是从中可以看到OpenAI的很多设想,我们基于OpenAI的这种设想来尝试回答上面的问题。
(是不是有点指点江山的感觉)
注:考虑这项目代表意义很强,下个月会开一期给非程序员解读Swarm的AI碰撞局,感兴趣的同学加shuixiu2024吧。
OpenAI的战略
OpenAI其实是同时在做两件事:
一、提升模型的基础能力,比如4o,o1。这部分不用猜是个人就知道。
二、把大模型变成一个超级通用的计算机。等于过去的程序员+应用+云计算。
给第二点做点说明。
过去程序员负责干的活主要是把大家的需求翻译成计算机能懂的语言,然后扔给计算机执行。翻译的结果就是各种编程语言。编译或者解释后的程序根据当前的你是要购物还是要搜索,来执行电脑或者手机上的指令。
在OpenAI设想的超级通用计算机上则完全不是这样。你搜索或者购物一定有个目的,你把这个目的说给它听,它直接就给你做了,给你结果。你不再需要关注搜索的关键词、购物要访问网站、比价等,你只要和它说清楚,它就给你办到。至于过程中是不是要调用搜索、选择什么样的关键词,全都是模型在判断和决策,不需要你打开一个个App,也不需要写程序去设定怎么完成具体的任务。
OpenAI在努力的两个点,一个有点像超级大脑,一个有点像超级智力输出的渠道。这个如果做成功了,那OpenAI等于智能时代的操作系统,基于通用智能的操作系统,啥都能干,只要你给它准备好输入。
这听着特别原教旨,但你仔细看Swarm,你就会发现它的目标就是这里。
在第二个视角下很容易理解OpenAI为什么做function call,为什么做结构化的输出,为什么干很多从模型研究角度看有点不务正业的事。
这是很现实的,如果不能占据智能产业中的核心枢纽位置,而是单纯的做技术输出,OpenAI是活不下去的。
你把大鲸鱼放小水池里,那就只可能苟延残喘。最终只可能是挂了。
多智能体(Multi-Agent)系统
Swarm展示的是怎么做多智能体协作,比如我们把卖东西简单分解为:卖货和售后支持,那这时候需要:卖货和客服两个智能体,同时为了能把货很流畅的卖出去还需要它俩配合。
如果我们把OpenAI正在输出的GPT4o等类比成一台超级通用的新计算机,那Swarm这个例子展示的正是基于这台新计算机完成上述工作的时候人干什么、这台超级通用计算机干什么。
我们可以看到完成业务目标的工作被划分成了两部分:
一部分是准备条件;
一部分则是把这些准备好的条件告诉OpenAI大模型。
然后你不用管了,它可以处理各种用户的请求和输入。
所有的Swarm代码演示的就是怎么按照OpenAI的规则给AI大模型准备好条件。
在OpenAI的设想中,这些模型起作用的前置条件包括:
1. 智能体之间流转过程的设定,比如销售之后客户不满意,那要转给售后。(这是土鳖的地儿,不是高级的地儿)
2. 处理交易的functions,模型会在合适的时候调用不同的functions。
3. 数据库的访问信息,包括账号、密码等
4. 提示词
还有些细碎的,但关键的大致就这些。
Swarm这例子被极度简化了,所以看着好像也没什么,但基于这台新的超级通用计算机做出的程序可以达成一个过去绝对达不成目标:Service as a Software。
在上面的例子里,理论上你只要和他说清楚,它可以帮你把任何东西都买回来:购买这种服务完全由一个程序提供了。
因为这个例子太简单,所以会有种貌似过去也能做的错觉,但关键是这模式在服务的复杂度上是可以拉伸的。理论上你可以加入800个智能体,他们排列组合能干购买就能干教育小孩等等。具有通用性。
关键卡点是什么?
当前离这种设想真的落地还很有距离。
OpenAI的战略要想落地,至少需要两个关键支撑点:
1. function call要精准。时灵时不灵并不全是重试就能解决的问题,重试的代价可能承受不起。有的时候在一个序列里面调用错了是有后果的。
2. Agent的配合问题。简单化当然可以写成A在某种情形下要把任务转给B,问题是真实场景下这玩意是多维交叉和复杂变动的。现在设想的方式估计不好使。这背后是个智能程度的问题。
上面这俩事搞不好,那这套系统就没法真有用,AI大模型会变成昂贵的一大坨鸡肋。
如果没法真有用,OpenAI就会呆在微软设定的位置干成模型供应商,整整就死了。前阵OpenAI内部人事大变动,我直观上就是和这个有关。科学家们可能宁死也要纯粹,企业家要先琢磨生存然后才是理想。
重看Service as a Software
实现Service as a Software和实现AGI差不多等价。
没有在复杂度上低成本的拉伸就没有Service as a Software。
在一定视角下Software as a Service可以看成是低复杂度的服务。那个年月软件整体能够处理的复杂度比较低,所以必须把某个服务中的一块切出来做成软件。
现在服务的范围可以低成本扩大了,这并不是本质区别,而是量上的拉伸,只要能拉伸的范围足够大,那就会让不成立的商业模式成立。
累积这种量变是打破过去SaaS魔咒的关键,否则还是太容易重蹈覆辙。
量变到一定程度就真的不是过去的SaaS了,但这种量上的拉伸需要超级通用计算机。参见:
小结
这事大家看到了苗头,此前红杉的文章和OpenAI 的Swarn都可以看成这个苗头不同侧面的描述。说的本质还真是一个事情。更有意思是显然的在国内成立比海外要难上那么一点点。这种难度其实是文化和企业制度所带来的。过去坚船利炮能够打破慈禧太后的保守,这次则说到底得看AI的真正威力。
热门跟贴