生成式AI未来三支柱：算法、算力、数据，创业投资的机会在哪里？|创业投资|大模型|机器人|生成式ai|算力|算法|计算机

作者：邵旭辉，Foothill Ventures管理合伙人，在机器学习、大数据系统和软件系统工程领域从事研发和管理工作多年，曾任雅虎广告及大数据平台工程副总裁、Turn CTO及ID Analytics副总裁。他持有清华大学自动化学士学位及明尼苏达大学EECS博士学位。

上个月的GTC后，生成式AI相关的讨论久久不能平息，这个月Gen AI领域刚刚宣布的两个高额融资消息也引发了大量关注：Augment以近10亿美金的估值融资2.27亿美金，Cognition则以20亿美金估值融资1.75亿美金。从文字chatbot到视频生成、机器人，生成式AI的能力不断拓展，应用潮已经开始，行业内外，大家都很关心这个话题：AI将会带我们到何处去？

作为AI、深度学习领域多年的从业者，曾经的大公司管理者、创业者以及如今的深科技领域投资人，我在此抛砖引玉，谈谈我对生成式AI发展的个人判断。

本质上，我认为生成式AI的竞争力根植于这三个维度：

一是算力及基础设施，这也是许多大公司优势明显的地方。

二是算法，当然也意味着算法背后的人才。

第三则是数据及应用场景，对创业公司来说，这一部分仍存在着大量机遇。

我们下面可以从这三个维度来生成式AI的未来。

【Gen AI并非算力竞赛，创业公司的机会在这些领域】

在算力方面，Nvidia是GPU的领头羊、CUDA生态的开创者，具有巨大的优势，但其实，未来的生成式AI并非绝对以算力定成败。

算力有限的创业公司或者科研机构，机遇主要在哪里呢？

首先，创业公司可以打造生成式AI的基础设施，解决底层的问题。

几乎所有的领域的公司，都在考虑自身在生成式AI方面的竞争策略。在数据隐私/计算安全、

准确性/可靠性、商业逻辑等等领域都会有很碎片化的的要求。而大厂的工具链服务链只能解决一部分需求，其他的就需要初创企业来填补。Lepton.AI、Corvic.AI、Fairly.AI 等都属于这个范畴。这些创业企业搭建了机器学习领域的基础架构，比如Corvic.AI，他们提供的解决方案让复杂数据能较为简便地转化为可用的企业级AI，提供预测分析、AI助手、数据标签等功能。

其次，虽然大公司在算力方面拥有优势，创业公司可以将目光投向专业领域——对于这些领域来说，持续积累的专业数据将会有着不可替代的价值，其中的行业壁垒、合规等方面的积累也能形成一定的护城河。

而更重要的是，不少领域（比如生物医药、网络安全、科研、制造）的底层逻辑和大模型擅长的语言文字视频并不相近，无法直接套用，也不容易简单的做二次开发就能获得好的结果。

从另一个角度来说，大模型也同样打开了许多新机遇，过去一些离商业化较远的领域可能忽然就有前进的动力了，其中往往会有创业公司的机会。

文初提到的AI写代码就是一个新出现的机遇，这两家企业都是近年来发展迅速的AI公司，Cognition的创立时间才刚刚半年。我们也投资了一个同类别的公司Metabob，通过AI来帮助人们找程序中的bug并修复它们。这类企业在AI与软件工程的交叉点找到了自己的市场。

近期机器人的热潮也是个很好的例子。

过去传统机器人往往只能解决单个任务，机器人的传感器、成本投入都有限，也限制了它的发展。

随着LLM的发展，机器人能够在虚拟空间通过强化学习（reinforcement learning）来进行学习、迭代、完成复杂任务，带来了一系列连锁反应——企业愿意开发拥有成本更高、能力更强机器人，这一行业也有了更多的想象空间与投入。斯坦福大学李飞飞教授参与的团队也构建了类似于当年ImageNet的针对虚拟空间训练测试机器人的基于物理模型的大规模训练场景。

今年3月，机器人公司Figure与OpenAI合作发布的视频引发了很多关注：金属覆身的机器人接入了OpenAI的大语言模型，能够迅速理解人类的意图并做出相应的动作，包括整理、准确放置物品以及完成一些相对模糊的指令——一名男子对Figure01“给我找个吃的”，机器人略思索后，拿起了桌上的苹果，并递给了他。值得注意的是，桌上还有四散的碗盘、沥水架等，苹果是唯一一个可食用的物品，这个简单的动作涉及了推理与思考过程，加上之前整理、收纳，机器人展现了完成多个复杂任务的能力。

除了Figure01外，ChatGPT引领的大模型风潮下，各类引入了LLM的机器人正在涌现：University of Michigan的学者也发布了基于大语言模型，能够更好地理解3D环境的家用机器人。在工业、农业、医疗等领域，可以想象，新型的机器人会带来很多的新变化。

【新型芯片及算法可能会重写垄断格局】

目前，在生成式AI的算法方面，呈现NVidia、OpenAI、Microsoft三巨头垄断的格局。不过在我看来，这样的情况也会在技术进展下面临变化。

这并非我一家之言，可以说，几乎是一个行业共识，只是很难预测它具体的时间点。

今年GTC上，Transformer的原作小组首次聚集，八位作者中的七位与黄仁勋对话，而核心观点就是：Transformer已经够老了，期待看到更新的模型。

作者之一、Cohere的创始人及CEO Gomez评论道：我想看到比Transformer好十倍的模型来替代它……Transformer在内存占用和许多架构方面都有优化的可能性，比如一个非常长的context是很昂贵、无法扩展的，它的parameterization可能不必要那么长，我们可以压缩许多倍，带来指数级的缩小。

从仿生学的角度来说，这个观点也很站得住脚——目前算法的功耗算力，跟自然界还有很大差距。

人的大脑功耗几十瓦。昆虫的大脑功耗是毫瓦/微瓦级的，神经元数量极少，也能完成特别复杂的立体视觉、三维控制、捕猎逃生等感知相关的行为。同等情况下，如果让电脑复现小动物在自然界里识别、控制、捕猎、求生的能力，需要更先进的模型，也一定会逐步出现更先进的模型。

而未来更好的算法与模型也很可能意味着更多专用的、小型的芯片会迎来发展。

比如我们此前投资的D-matrix，主打存内计算，预计将在2024大规模量产，目前已经有大量订单。另一个模拟计算芯片设计企业Tetramem也备受关注，已经发布了多篇Nature论文，

除此之外，开源的相对小型的transformer 模型（如Microsoft's PHI-2 and Mistral 7B）也会迎来快速发展。在我看来，这些开源的小模型对于AI行业持续、健康的发展是很有必要的。这次AI的热潮与以往的科技潮不同，大公司并未占据所有重要的研究方向——谷歌上市时，许多大学就停止了对搜索算法的研究，因为谷歌已经有了很好的团队和资源来推进搜索算法。而生成式AI则不是，对于研究机构而言，这些开源的小模型中还有很多值得探索的地方，目前所有名校的计算机系也都在积极研究开源模型。

甚至可以说，文初我提到的、未来我们期待的新的算法很可能就会从这些科研人员的工作中涌现。

【 GenAI发展的背后是人才之争】

这个对更新、更好的生成式AI算法的期待，也意味着另一件事：生成式AI的竞争也意味着人才之争。

目前，中美是在AI人才方面占据全球一二位置的两个国家。

从绝对人数来说，中国占据了第一位——今年三月，纽约时报报道了一个追踪AI相关人才的报告，中国有着全世界最多的AI本科生人才，而与三年前相比，如今在美国的顶级AI人才中，中国人的比例也已经超过了美国人。比起过去，这些中国人才在美攻读学位后，也更多地“回流”中国。

当然，美国有着世界数量最多的一流大学，与创新气氛浓厚的科技企业，也孕育出了将LLM石破天惊带入大众视野的Open AI，对各国的AI人才仍旧有着强烈的吸引力。

不可否认，基于天时地利人和等方面考虑，中美牢牢占据了未来AI发展综合最优的前二宝座。

在这个背景下，还有一个值得注意的趋势：人才的两极分化。

由于AI+ 的杠杆作用越发明显，创立一个优秀的AI企业所需要的技术人才的数量比几年前已经显著减少了。企业接下来对人才的竞争，会越来越集中于少数顶尖人才的争夺。

无论在硅谷还是在北上杭，我们已经看到顶级AI人才被高价争抢，而普通大学生找不到工作的这种两极分化，而这样的趋势未来也会更加明显。

【Gen AI将成万亿美元市场，投资人如何入局？】

从我和我身边的创投从业者的角度看来，我们的共识是Gen AI的未来是光明的——Bloomberg Intelligence报告预测，GenAI将成为未来十年发最迅速的市场之一，市场总量超过万亿美元，复合年增长率超过40%。它变革性的能力会影响各行各业。

对于投资人而言，如果想要投资这个市场，我有以下建议：

首先，投资生成式AI项目，本质上仍旧是在深科技技术中寻找那些具有商业化潜力的项目。投资人最好能具备AI相关技术背景，并且保持持续学习及市场敏锐度。目前生成式AI的技术变化、突破、市场都在迅速发展。比如此前一些挂着大模型名号的项目，也许在ChatGPT某次更新后就会完全失去市场，能够识别这些项目，可以帮助规避许多风险。

其次，正如文初分析的，目前生成式AI的支柱分为人才/算法、算力、应用/数据三大方向。作为投资人，前两者的投资难度较大，然而应用/数据中，有着大量的未来机遇，可以考虑投资一些相关资源。

比如应用场景和应用场景相关的数据——对于中国投资人来说，半导体、新能源、先进制造都是不错的方向。以制造业为例，拥有大量垂直行业内的数据，才能做出好的AI，指导未来的先进制造。

从时间上来看，技术上如果不能特别确定，也可以等一下商业落地的信息，付出一些增值成本来换取更稳定的信号。

有关AI，这个问题我常听到：AI能最终代替人类吗？

我认为这要从不同尺度上去理解——我们究竟在讨论的是AI从什么程度上在挑战人类进化？如果是生物体层面，这有着百万年以上的积累，是最难的；从人类认知层面，也至少有10万年进化横亘在AI面前；而出现数千年的人类语言相对更容易；出现仅100年的计算机语言则最简单。

这个问题的答案当然没有定论。不过在这个最终将达万亿美元、改变人类生活的市场里，我很期待看到更多来自华人参与者的身影，不管是创业、投资，还是积极地拥抱生成式AI让生活、工作变得更高效，它将前所未有地改变我们与世界交互的方式。