21世纪经济报道记者 申俊涵 北京报道

今年以来,ChatGPT的火爆出圈正引领新一波的AI浪潮。从国外的谷歌、微软、Meta,到国内的百度、阿里、腾讯、字节跳动,各大科技巨头纷纷加入这场AI军备赛。

能够带来伟大成就和巨量财富的地方,时常伴随着创新创业热潮的翻涌。王慧文、李开复、王小川等在科技领域、创投领域富有号召力的大拿们悉数登场,将这份AI创业的“英雄榜”变得越来越长。

其实从1956年人工智能的概念首次提出以来,人工智能行业经历过多次从高潮到幻灭的过程。此次ChatGPT的出现,再次让大家内心受到震撼。不少创投圈人士对记者表示,AI大时代所带来新鲜感和振奋感,比十年前移动互联网时代到来时还要更加强烈,而这或许也是诸多业内大咖选择跳出舒适圈奋力一搏的主要原因。

“我们惊叹于AI大语言模型的能力,让人工智能比以往任何时候都更接近人类、更加智能化,这让我们充满期待。”近日,创世伙伴资本CCV合伙人梁宇在接受21世纪经济报道专访时说。

在他看来,现在是通用人工智能(AGI)的奇点时刻,同时也是商业化应用的前夜。AI大模型还没有经过大量的商业包装和训练,需要从业者像园艺师一样去修剪,形成符合行业规律的商业化产品,这也正是创新创业的机会所在。

创业门槛急剧拉高,机构出手更加谨慎

《21世纪》:业界许多人把今年称之为AGI元年,您怎样看待ChatGPT所引领的这波AI新浪潮?

梁宇:倒推来看,2017年是真正的AI元年。当时Google团队发表论文《Attention is All You Need》,该论文提出了一种新的网络架构,称为Transformer。它仅仅采用注意力机制,不需要循环或卷积。

此前,机器学习的主流方法是深度神经网络带监督的学习。这篇论文出现以后,方法论开始转向。ChatGPT的GPT模型、谷歌的LaMDA大模型和百度的文心大模型都是基于谷歌的开源Transformer模型,在其基础上不断迭代。一直到OpenAI蛰伏五六年后,率先推出现象级应用ChatGPT。

其实内心最受震撼的不是普通用户和投资机构,而是产业人士。在上一波的人工智能创业浪潮中,大家预期很高,但实际产品效果根本达不到。一直到去年,很多人内心是存绝望的,也找不到突破的方向。ChatGPT出来后,大家才醒悟过来,原来人工智能可以做到这个程度,美国硅谷的热闹程度比中国还要早六个月左右。

《21世纪》:2016年AlphaGo打败李世石是上一轮AI创业热潮中的标志性时间节点,后来国内也出现AI四小龙等明星创业公司。现在我们再次看到很多投资界、创业界人士进入AI领域创业,这两轮热潮有哪些不同?

梁宇:首先,这一轮AI创业的目标更加精确。上一轮的AI创业大致集中在两个方向,机器视觉和无人驾驶,大家基于想象,不知道真正的工程能力能做成什么样。这一轮的创业更加聚焦,OpenAI给大家打了个样,所有的人才和资源都在向大语言模型的方向聚集。

第二,这轮AI创业的门槛被急剧拉高。构建大模型的算力成本更高,同时对底层大模型有真知灼见的算法人才非常稀缺。当然,经过上一轮AI产业的大浪淘沙,成功的创业者积累了深厚的根基,失败的创业者也积累了足够的经验,整体创业者的素质会更高。

第三,大环境本身也发生了很大的变化。上一轮AI创业热潮中,政策市场和创投市场环境都更加开放。现在创业者和投资机构都变得更加理性,有些人确实是在上一轮的狂欢中被伤到了。

现在凡是跟AI沾边的公司估值都比较高,因为需要的投入确实很大,行业天花板都很高,行业中也会有人去追逐高估值。但优秀创业者和优秀投资人的结合还是比较理性的,我们不能脱离事实的想象构建商业未来。整体来说,目前还是Gartner曲线(技术成熟度曲线)向上爬坡的前夜,大家都很兴奋,对产业的未来充满期待,但出手比较谨慎。

国内大模型追赶ChatGPT仍需时间,应用层创业机会更多

《21世纪》:您是否看好国内的类ChatGPT应用?跟OpenAI相比,国内做大语言模型的团队差距主要在哪些方面?

梁宇:我们是非常看好国内AI创业的,相信在中文语言环境和法律法规下,一定会出现中国的类ChatGPT应用,它们在中国市场也会更具竞争优势。但跟OpenAI相比,国内团队做大语言模型在三方面仍存在差距。

首先是经过优秀标注的数据集。目前中文数据集还在追赶阶段,随着业界共同努力,花钱、花时间来做这件事,这是能够赶上的。

第二是算力层面。去年,美国政府要求芯片厂商英伟达停止向中国销售部分高性能GPU芯片。这种对算力的封锁,拉长了大模型训练的时间。

第三是算法层面。语言模型能否做到像OpenAI那么智能,算力并不是最重要的因素,最重要的是算法层面。语言模型该怎样调参才能达到好的效果,这有点像可口可乐的秘方,需要不断的探索和研究。

更重要的是,我们希望大模型公司可以把平台留给开发者,就像IOS做的一样,让应用层参与者更多去做垂直领域的事情。如果这件事实现了,中国就很有优势。因为中国的公司在应用场景的开发上,在应用场景的丰富度上是远远超过美国公司的。中国公司在应用场景丰富度开发上和商业落地上,是走得非常快的。

《21世纪》:目前国内语言大模型市场的竞争格局是怎样的,您看好哪一派?

梁宇:首先是百度、阿里、腾讯、字节跳动等巨头公司。大厂的优势在于他们有实力不断投入资金、资源,有可能最先形成数据飞轮。

第二是国内一些技术实力雄厚的研究院。比如创世伙伴CCV聊过的两个团队,一个是北京智源人工智能研究院,他们几年前就开始专注在做语言大模型,语言训练的效果非常出色。2019年,他们成立了独立公司智谱AI,由清华大学唐杰教授担任首席科学家。另一个是沈向洋博士创立的IDEA研究院(粤港澳大湾区数字经济研究院),同样具有竞争力。我们很欣赏这种在大模型上扎实做了几年研究工作的公司。

第三,大家看到的王慧文、李开复王小川等创业老兵,同样有机会做这件事。在科技领域、创投领域有影响力的人进军这个市场,能够帮助中国市场快速产出有价值的大模型。越是在竞争的环境中,创业企业的进化是越快的。

《21世纪》:我们注意到还有些公司基于数据集、算力、算法方面的困难,会战略性放弃做语言大模型,而是在特定的领域做相对的小模型,您怎么看待这件事的前景?

梁宇:大语言模型市场的竞争确实已经进入到白热化阶段,我认为除了百度这样的巨头之外,还会诞生一两家大语言模型公司。对大模型的投资是具备高风险、高天花板的,也是值得投入的,我们会支持跑在前面的大语言模型创业者。

同时值得注意的是,当百度、阿里等大公司专注在语言大模型战场时,基于Transformer的小模型对创业公司来说是更富有机会和商业前景的,我们也很关注这个领域的投资机会。

比如横向来看,在美国有家AI绘画公司Midjourney,它的底层模型是以文生图的模型,目前已经是10亿美元估值的独角兽公司。除了图片,3D领域的3D模型、3D环境生成,以及声音、视频领域同样富有机会,市场中还没有形成领头羊的局面。

纵向来看,做独立语言模型的公司必须跟产业结合才能拿到精确的数据,去帮助训练各种场景,这是未来商业化的根基。医疗、金融、汽车、游戏场景都具有产业机会,能够形成产业壁垒。

创业团队须兼具商业化能力和底层模型研发壁垒

《21世纪》:在ChatGPT所属的AIGC领域,创世伙伴资本近年做了哪些投资?

梁宇:在AIGC爆发的前夜我们已经投资了一些公司,他们所做的事情可以归为AIGC领域。比如我们在2017年A轮领投玩美移动PERFECT,这家公司成立于2015年,是一家人工智能(AI)和增强现实(AR)美妆与时尚技术商业解决方案提供商,去年已经在纽交所上市。玩美移动在3D空间生成人脸,为企业和消费者提供虚拟试妆及智能肌肤侦测等服务。

另外,我们还投资了AI医疗公司数坤科技,目前正在IPO进程中。它用自创的底层模型大量阅读CT影像和MR影像,生成人的数字三维模型。延伸来看,我们在垂直的无人车感知、3D环境生成领域也在进行投资。对我们来说,AIGC将是今年非常重要的投资赛道。

《21世纪》:在具体投资过程中,您倾向于投资什么样的创业团队?

梁宇:我们非常看重公司的产品商业化能力和行业认知,它要知道如何设计垂直领域的产品,如何抓住用户、增强用户黏性。同时在这个基础上,公司还需要在底层模型上有自己的研发能力,建立起高壁垒。

比如美国有一家成立两年的公司叫Jasper,它的底层技术模型来自ChatGPT,基于它进行产品化,做自动营销文案生成。Jasper的应用反馈情况非常好,很多文字工作者愿意付费订阅,公司也很快成长为独角兽公司。但ChatGPT出来以后,这项服务免费提供给用户,Jasper的价值是急剧下降的,它向用户收费变得不再容易。

所以创业公司要有自己的模型能力,否则即便前端应用包装得再好,当大象稍微踏过来一脚,它的脚指头就把你踩死了。当底座足够扎实,即便遇到浪的冲击,也没那么容易被击倒。

另外,创业者要理解产业,积累在垂直领域的数据。如果能够得到国家队的支持,获得来自政府的数据资源,或许能够真正帮助公司实现腾飞。比如政府部门有行政数据、公民数据、医疗数据等,这些数据脱敏之后开放给公司,将帮助语言模型训练得更好。