文/二湘

这几天中国一个初创公司的AI产品,Manus,引起了国内一些所谓的AI 大V的狂欢。什么整个硅谷都在讨论,什么太震惊了,什么炸裂,史诗级发布,比肩Deepseek之类的用词,看起来非常振奋人心。

Manus据称是业界第一款通用AI代理,什么是通用 AI 代理(General AI Agent)呢?就是具备自主学习、推理和决策能力的人工智能系统,能够在多个领域执行多步骤的任务。现在我们用的AI,不管是GPT,还是Deepseek,基本就是你问我答,只能执行一步,但是通用AI代理可以完成复杂的多步骤的任务。

举个例子大家就明白了。比如,你告诉它“帮我规划一次去伦敦的旅行”,它不会像现在的生成式 AI 那样只是返回一些航班和酒店的搜索结果,而是会综合你的预算、时间、兴趣点,自动帮你订机票、酒店,生成行程安排,甚至提醒你办签证、兑换货币等等,如果你的计划有变,它还能自动调整。这种 AI 代理不只是被动地执行简单的指令,而是能做决策,能真正的做事情,完成任务,就像一个真正的人一样。

如果是这样,那么人类就相当接近AGI了。看他们官方发布的视频,几个任务也都是很顺畅地执行,自动生成一些报表和文字,看起来挺impressive的。

但是又看到说这个产品其实并没有正式上线,现在还是内测阶段,要内测就要有测试码,据说一个测试码要一万,有的还炒到了两三万。这就有些不正常。

之前chatGPT和deekseek出来的时候,我都写过文章,尤其是Deepseek,那时候质疑Deepseek抄袭openAI的声音很大,我还专门写了一篇文章《Deepseek是真正的创新还是穿着AI皇帝的新衣?》力挺Deepseek。我自己亲测了Deepseek,而且认真看了他们的技术论文(technical paper),还四处咨询了一些AI做同类产品的大拿,他们业内的反应都是Deepseek是非常不错的产品,是真正的国货之光,我才放心写文章。

这次Manus,我没有亲测。某大V说整个硅谷都在讨论,但我问了一些硅谷的AI工程师,他们反应都是没怎么听说过。这就很奇怪,他们的发布视频全程都是英文,网站也都是英文,显然是面向国际市场,为什么硅谷做AI的朋友都没怎么听说呢?我又去搜了一下,也没有什么大媒体报道,只看南华早报有报道。上次Deepseek爆火是因为Meta的几个工程师在社交媒体谈到Deepseek多厉害,然后迅速出圈,被美国多家主流媒体如《华尔街日报》《华盛顿邮报》《纽约时报》相继报道,接下来才回流到国内的媒体。

我又去X看了一下,相关信息非常少。Manus自己的X账号是2025年3月才开的。而Deepseek是2023年10月入驻X,到2025年2月发布R1,中间有一年多的时间了。Manus感觉是为了宣发才匆匆进驻美国的社交媒体。今天最新的消息是Manus的X账号被冻结,据Manus的创始人季逸超说,此次封禁可能与第三方提及的加密货币诈骗相关,与他们的运营完全无关。

然后很快我又看到一些自媒体的质疑声音了,我比较信任的一个科技自媒体博主包老师认为Manus和一些鼓吹Manus的自媒体很快就要塌房了,他还提到他后台助理有收到一个AI代理项目的推广合作,但他的助理说他们不接付费广告。包老师说Manus已经成为测试科技自媒体良心和专业水准的试金石。

那么,Manus会不会是像姜萍事件那样的造假呢?我认为也不太可能,毕竟他们的创始人还是有一定的credibiity。创始人肖弘毕业于华中科技大学,有连续创业的经历。首席科学家,也就是发布视频里的那个叫季逸超的小伙子,也算是业内有点小名气,曾经创业还拿到过真格基金的投资。另外就是,有几个拿到测试码的博主,自己亲测过,觉得还行。比如一位MIT的技术博主亲测后认为是good product,but not a technical breakthrough,就是还不错,但也不是什么技术突破。他认为Manus不够好的三个理由:

1. 它主要遵循事先定义好的流程来执行任务。这种预定义的流程在短期内还行,但从长远来看,它会显著限制系统的功能。

2. 它运行在一个相对受限的环境中,介于浏览器和操作系统之间。在预定义的软件工具之外,它就无法运行。例如,它无法控制 PowerPoint 来为你制作幻灯片。但实际运用中许多软件都超出了 Manus 的工具箱范围。

3. 真正的技术突破应该是在一个完全开放的、操作系统级别的环境中,能够像人类一样完成大多数任务并操作各种软件。

根据这位博主的说法,这个产品既不是下一个Deepseek,也不是姜萍,应该是介于其中的一款还可以的产品。

技术上来说,Manus做的就是一个串联和缝合不同模型和工具的事情,它的短板是没有自己的模型和硬核技术。Manus第一步就是要求事先写好一个任务流程,然后根据这个流程,调用大模型获取信息,比如伦敦的航班和景点,第二步就是用推理模型分析这些信息,然后再用LLM调用不同的工具来做不同的任务,但是他能调用的工具也很有限,都是他现在的环境限定的几个工具,比如浏览器,虚拟机和Python,用Python自动编程生成网页,订票等等,最后把你的结果展示在网页上。Manus 纠错能力比较差,稍微出点差错就不行了,因为Manus用的是固定的流程,比较死板,离真正自主的智能体还差很远。相对而言,Open AI的智能体用的方法就不一样,它用的是一个单独的模型来处理不同的任务,直接和环境互动,这样,就可以处理不同的情况,处理复杂的任务,容错能力也强很多。但是这样来说,技术上难度大很多,当然也就很贵。现在,OpenAI的AI agent要价是2000到两万美金。实在是太贵了。

当然Manus团队肯定也是有聪明人,技术上肯定也是在不断地改进,最后到底是骡子是马我们还是再等等。不过我觉得他们的产品在业内科技圈还没有站稳脚跟,就这样找自媒体自夸自擂的风气实在不太好,有些急功近利了,这样的营销反而可能起到负面作用,还是要踏踏实实做出产品,长期积累,以技术和创新取胜,先得到圈内人的认可,才可能出圈。

另外,不管是自媒体还是媒体,对一件事情做出判断之前还是要做一些尽职调查(due diligence),自己要不断求证,做fact check,尤其现在这么容易造假,很多信息本身就不准确。另外不能迷信主流说法,人云亦云,不能为了迎合大众而违心地说话,更不能为了钱说瞎话,要有自己的独立思考,自己的判断,要有质疑精神,也不要预设立场。

姜萍事件的时候,我是少数发出质疑声音的博主,连续发了好几篇文章《达摩院道歉,姜萍事件真相水落石出》,那时候很多博主都坚信姜萍是真天才,甚至说质疑姜萍的人都是卑鄙无耻的,许多人还留言辱骂我,我还是坚持自己的立场。而到了Deepseek,许多人因为惯性地对国货不信任,又认为Deepseek是造假抄袭。我又力挺Deepseek,因此又被许多老读者不理解。

空间美国书店可发货到美国

其实不管是姜萍,还是Deepseek,我都是本着求真求实的精神,自己求证,做调查,又咨询业内专家,既保留质疑,又不带偏见地做出判断。只有这样,才能慢慢积累一个平台的可信度,如果一个平台多次对一些事件做出错误的判断,那么这个博主的判断力就要大打折扣,将来的可信度也会降低。

作者:二湘,喜欢码字,著有长篇小说《暗涌》《狂流》,小说集《重返2046》,最新小说集《心的形状》。

~the end~