从前两年的百模大战,到如今诸多互联网大厂纷纷躬身入局,大语言模型赛道竞争之激烈可想而知。而在这场较量、角逐中,无数细分垂类赛道也跃跃欲试,3D基础模型则正是其中之一。

投中网近日获悉,3D大模型公司VAST在一年内,先后完成数亿元天使轮及Pre-A轮融资。并创造了3D大模型赛道的最大融资金额。天使轮领投方为绿洲资本,Pre-A轮领投方为达晨财智以及春华创投,英诺天使基金、水木清华校友种子基金跟投。

在过去一年里,3D大模型赛道涌现了诸多玩家。5月,a16z 宣布以500万美元领投3D角色生成公司Yellow,还投资了Kaedim和CSM等其他3D模型公司。7月,Meta发布了其文生3D模型技术Meta 3D Gen,能够在1分钟内生成高质量3D内容。这些发展标志着3D大模型技术的快速进步与广泛应用。

文字、图片、视频、3D、声音等不同载体是AIGC的各个分支,VAST成立于2023年3月。CEO宋亚宸表示,VAST通过3D大模型Tripo,致力于构建一个全民内容平台,将3D空间作为用户表达的重要方式。

本轮VAST所筹资金将主要⽤于技术研发及团队扩张、深⼊推动产品商业化发展、进⼀步扩⼤⼤规模算⼒中台、强化⽣态合作等。

发现蓝海,杀出重围

VAST的初衷并非打造一家大模型公司,而是基于长期兴趣和文化背景,捕捉到一个尚未被充分开发的机会。他们发现,文字、图片、视频、声音和3D等都是信息表达的载体,但唯有3D还没有发展出自己的UGC(用户生成内容)平台。

过去,内容平台在移动互联网时代被多次验证为成功模式,比如抖音、快手、小红书、微博和知乎等。而如果未来能够出现一个3D版的抖音,用户可以在其中体验丰富的游戏化内容并进行互动,这无疑是一个巨大的商业机会。

VAST在探索3D内容社区的过程中虽然面临了一些挑战,但这也促使团队积极寻找解决方案。由于3D创作的门槛和成本较高,早期经历了用户增长缓慢的阶段。

制作一个高质量的3D内容,往往需要动用数百人,耗费数年时间,且花费巨大。宋亚宸认为,生成3D内容的难度类似于拍摄电影、撰写长篇小说,甚至像是米开朗基罗的画作,属于“精英艺术”的范畴,普通用户难以涉足。

这让他意识到,要实现真正的大众化3D内容平台,必须先解决工具问题,降低创作门槛。正如其他内容媒介从精英艺术转向大众创作的过程一样,3D内容也需要经历类似的转变。

首先,3D创作属于精英艺术;接下来,需要开发出大众级别的创作工具,降低创作成本并加快反馈速度;最终,才有可能催生一个内容丰富、种类多样的UGC平台。换句话说,VAST的目标是通过提供易用的3D创作工具,降低内容生产门槛,丰富内容生态,从而逐步积累起创作者、消费者和开发者,最终实现构建一个面向大众的3D内容平台的梦想。

有了清晰的目标,VAST针对性的进行技术研发。2024年初,VAST推出了基于千万级3D高质量原生数据库训练的大模型Tripo 1.0,该模型允许用户在8秒内通过单图或文字生成3D网格模型。上线半年内,全球用户已生成超过500万个3D模型,几乎相当于当前全球前三大3D模型交易网站的总和。

近期,VAST发布了Tripo 2.0,通过融合DiT和U-Net模型的新架构,显著提升了3D模型的几何形状和材质输出质量。在全球匿名测试中,Tripo 2.0的生成效果始终保持领先,宋亚宸称其表现已达到Midjourney V4的水平,展现出巨大商业化潜力。

VAST的技术应用主要覆盖四个场景:传统CG行业,如游戏、动画、虚拟制作和影视;传统互联网领域,如电商、教育、直播和社交;3D打印工业设计,包括鞋服、家居、首饰、食品等;以及新兴行业,如元宇宙、数字孪生、具身智能、仿真模拟和数字人,而这些场景的拓展为大众提供了虚拟制作能力。

成立一年多,VAST已初步发展了300多家客户,包括与全球家用3D打印机龙头企业合作,以及拓竹的Markerworld和Anycubic旗下的Makeronline等平台的上线。

相较于文本和图像,3D内容的人工生产成本要高得多,因此用AI取代人工进行3D建模,能显著降低成本。当被问及现有技术是否足够满足艺术家和创作者的需求时,宋亚宸认为大模型会不断迭代,VAST的Tripo 2.0预计在年底达到V5水平。

他相信,随着3D从精英艺术向大众表达媒介的转变,将形成一个万亿美金的市场,尽管这一过程需要时间和工具的持续迭代。当前,VAST在全球竞争中已经崭露头角,并展现出强劲的增长势头,其未来的长期优势值得期待和关注。

出海,当然要更高的商业化天花板

VAST的创始人兼CEO是宋亚宸,本科毕业于约翰霍普⾦斯⼤学,曾在商汤科技负责AIGC技术在动画及游戏等项目的实际落地,后来也曾参与创立AI独角兽MiniMax。

2023年初,宋亚宸创立VAST时原以为融资会很顺利,但由于经济寒冬和风投对尚无明确趋势的项目持观望态度,融资遇到困难。尽管他接触了六七家财务顾问,却未能成功融资。因此,宋亚宸决定暂时搁置融资,专注于组建团队并推动业务发展。

首席技术官梁鼎,清华大学本硕博,发表过50余篇论文及拥有100多项专利,累计引用近万次。曾任商汤科技通⽤模型负责⼈,在人工智能领域探索十余年。

首席科学家曹炎培,清华大学本科及博士,曾在腾讯ARC实验室和人工智能实验室领导⽣成式3D⼯作。师从胡事民院士,有超过70篇学术论⽂和创新成果,曾联合创立3D全息公司Owlii,后被快⼿收购。

到了2024年初,Sora横空出世引发资市场对多模态大模型的关注,VAST也借势快速完成了Pre-A轮融资。

达晨在内容生成方面已经布局了大语言模型、文生图、文生视频等,而文生/图生3D是“新文明”拼图的最后一环。正如“AI教母”李飞飞的观点,人类是生活在3D世界中的,而人工智能要真正追上人类,必须突破3D的理解和生成,而面向C端的3D创作工具就成为了关键环节、重中之重。

相比较VAST在2B方向对于传统建模师的帮助,达晨更看好其在2C方向对于广大消费者生活方式的改变。试想一下,大到房屋家具、小到鞋包杯碗,身边的物品都可以按照自己的心意来设计和制造,个性化将得到极大解放,每个人心中的创意都将得以展现。如果再配合上MR眼镜,可以随时随地改造世界,在下一代互联网中共享空间文明。

春华创投负责人邹凌表示,3D动画和游戏蕴藏着千亿级市场势能,然而目前却受限于生成效率和成本,这种错位很快将被人工智能技术改变。VAST拥有明星技术团队,管理层积累了全周期的技术创业经验。公司已经结合技术优势和内容平台,形成数据飞轮。

宋亚宸认为,VAST在融资过程中的核心竞争力主要体现在三个方面。

首先,团队从创业早期就确定了数据驱动的重要性,积累了2000万高质量3D数据,领先竞争对手1至2个数量级,这一前瞻性策略使其在数据资源上具备显著优势;

其次,团队不断探索3D的最佳表达方式,通过寻找更好的token,实现高保真、高还原和高压缩能力,从而更有效地结合3D模型数据与大模型进行训练;

最后,VAST凭借早期在3D模型生成领域的卡位优势,吸引了全球顶尖的研究人才,建立了千人规模的科学家网络,确保技术路径和前沿研究的统一。这些因素使得VAST在竞争中占据了领先地位。

在与投资者的接触中,宋亚宸发现中美资方对3D生成模型的态度存在显著差异。美国投资机构如a16z等积极投资了Luma、Yellow和CSM等多家3D大模型公司,认为游戏、社交和元宇宙是AI的关键应用场景;而在中国,具身智能和AI陪伴类应用被视为更具市场潜力。这种差异促使VAST从一开始就立足于全球市场。

在宋亚宸看来,传统视频拍摄是由神创造了一个世界,人选择位置和角度进行录制,而虚拟制作则是由人创造一个世界并进行拍摄。随着3D大模型技术的成熟,未来的视频中将有更多内容通过虚拟制作生成,从而对视频行业带来深远的冲击。这种技术的发展将显著拓展视频创作的可能性,推动行业进入新的发展阶段。