文/熊莫

导语

国人团队做AI 3D,拿下数亿融资

“头部3A大作里用过的高精古建扫描资产,在可见的未来就能被AI部分替代掉了。”“新模型发布后,我们的订阅用户和ARR环比增速翻了四倍。”“目前最大的一家游戏公司客户,每年给我们付费百万美元。”

前几天,茶馆君受邀前往影眸科技位于上海的办公室,观看了他们前阵子发布的最新AI 3D模型Rodin Gen-2.5的效果演示,并和两位公司创始人CEO吴迪、CTO张启煊深入交流了一番,于是便有了以上这些对话。

打开网易新闻 查看精彩图片

今年GDC期间,影眸科技的展台

从年初开始,茶馆君就一直在密集关注AI在游戏3D生成领域的进展。原因说来可能有点奇怪:因为它的进化来得有点“太慢”了。

你看,Claude Code、Codex、Seedance、Suno这些工具一批批成熟,AI基本已经把游戏行业各个岗位的日常工作方式改了个遍。2D美术、文案、程序,乃至买量投放,都在经历程度不同的重塑。

唯独3D美术,一直像是AI战线稳步推进过程中的一处豁口。直到几个月前,我和美术朋友聊起这个领域,最前沿的几款AI工具也还大多停留在“只能预览、没法交付”的状态——要么是把AI生成的模型放在关卡白模里看看效果,要么是在2D概念转3D建模时大致做个参考。那时AI生成模型还没有迈过可用门槛;而后续拓扑、展UV、刷权重这些真正的“苦力活”,仍然需要美术人员亲力亲为。

这也是AI 3D最让行业纠结的地方:它看起来离游戏很近,真正进了管线,又总是差了几步。

而现在,有一群人在试图补上这段差距。作为国内深耕AI 3D领域的头部企业之一,影眸科技刚刚新一轮数亿元人民币融资。本轮融资由凯辉基金、上海国投先导领投,老股东持续跟投。他们没有刻意去讲世界模型、具身智能的宏大叙事,而是更专注于做一套足够好用的工具:形成AI 3D创作的全套工作流闭环,把垂直场景里的真实生产需求一层层打透。就这样一路做到数千万美金的ARR。

打开网易新闻 查看精彩图片

尤其是在看到Rodin Gen-2.5的实际效果后,我觉得它主打的全球首个千万面超高精度生成、12K高清材质、原生3D纹理等特性,已经能够在游戏3D建模工作流中扮演一个足够有意义的角色。

乃至于,距离游戏3D管线像其他领域那样被AI系统性改造,可能真的只剩下一到两次关键迭代了?

01

游戏3D的第一步,终于走稳了?

在此之前,“技术派”是外界对影眸科技具有的印象——他们是上海科技大学实验室孵化出来的初创公司,连续多年获得过国际图形学顶级会议SIGGRAPH最佳论文及提名,算法团队每两人中就有一人获得或提名过最佳论文。乃至于,目前AI 3D行业集体使用的3D原生生成框架CLAY最早就是由影眸在2024年提出——他们是整个行业发展拐点的缔造者。

成立公司后,他们一直在从学术界向产业界走。到了今年,Unity在GDC现场演示Unity AI Beta、网易在《蛋仔派对》《燕云十六声》里为UGC做实时资产生成,乃至英伟达创始人黄仁勋在CES现场做机器人主题演讲,都直接使用了影眸的Hyper3D Rodin模型。吴迪透露,目前影眸数千万美元的年ARR中,有约一半由B端大客户贡献,续费率几乎达到100%。

打开网易新闻 查看精彩图片

而这样一个团队端出的最新成果Rodin Gen-2.5,究竟有哪些亮点?直接看表现。

上传一张参考图,经过数秒到数十秒的可控时间即可生成模型。整体结构比例稳定,不容易走样,对卡通、魔幻、写实等不同风格都能够较好掌控。而和以往我们印象里的AI 3D模型最大的不同之处在于,即便把模型缩放到最大仔细审视,也不那么容易找出破绽了。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

皮包上的牛皮纹路、人脸上的汗毛、褶皱,乃至虹膜这种微结构,都清晰可见。硬表面足够硬,几乎没有发软的边缘和模糊的线条——这种近乎人工精雕级别的精度,是直接体现在模型层级上的。至少在观感上,它已经明显不同于过去那些“远看还行、近看崩坏”的AI 3D模型。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

张启煊解释道,这是Rodin Gen-2.5以最高档位Extreme-High搭配Micro微观模式生成的效果,整个模型生成时间大约80秒,精度高达千万面,在当下处于全球第一梯队。与此同时,他们还提供了五档精度生成选项,就像语言大模型的不同思考深度一样,通过可变token和不同生成时间,输出不同精度、不同面数的模型,最低档模型只需4秒即可快速生成百万面级模型。

Extreme-High用于高写实场景,其他档位则可以覆盖风格化卡通模型、小型物件、UGC预览等更多层级的需求,让用户根据不同生产场景自行选择。这其实是AI 3D走向专业工具的一个重要变化:模型不再只追求单一维度的“更清晰”,而是开始把选择权交还给创作者。

Gen-2.5的另一项新特性,也是冲着3D生成模型的能力死角去的——它首次搭载了基于3D原生生成的外观生成模型。

以往AI模型做材质生产,通用方案是投影法,即用多角度照片合成材质贴图,缺陷很明显:颜色断层、PBR材质不准确、凹陷区域照不到、不同材质容易串色。比如头发颜色跑到皮肤上、金属质感被误判成普通漫反射,都可能导致模型在后期无法直接使用。

影眸则自己训练了一个新的外观模型。据张启煊介绍,其难度几乎比肩从零训练一个图像生成模型,换来的是贴图和模型更贴合,材质品质也更稳定:金属、木头、皮革的不同光泽,乃至材质上的Logo和文字,都可以相对准确地生成。

超高精度加上原生贴图,二者结合实现的效果其实传递出一个很强的信号:如今像Hyper3D Rodin这样的AI模型已经越过生成品质线,超越单纯“生成得像”的阶段,能够拿出在特定环节里可交付的资产了。

游戏的3D管线往往以高模为起点,百万面乃至千万面的高模,需要经过重拓扑、展UV、减面、拆件、烘焙等一系列环节,最终成为可在游戏内运行的形态。张启煊表示,影眸的客户里,一些中小型公司已经会直接将低模用于最终游戏成品;而更多海内外游戏工作室,则已经把Rodin Gen-2.5用在高模阶段。

原本需要雕刻师精雕数日、数周的大型模型,如今几分钟就能迭代出好几版,再选出最好的结果送去进行后续处理。

打开网易新闻 查看精彩图片

当然,“降本增效”已经是AI领域的老生常谈。相比之下,我觉得Rodin Gen-2.5更重要的意义在于,它让AI 3D模型在游戏管线里完成了一次从“不可用”到“局部可用”的跨越。

比如文章开头提到的张启煊的判断,像《黑神话:悟空》里用到的一部分扫描资产,未来都可以使用AI高效生成,并在一定程度上替代。凭借Rodin Gen-2.5这样的模型,使用高精度资产的机会,可能从行业里极小一部分人,扩展到更多中小团队和普通开发者手中。

况且影眸自己本来就是3D扫描领域的专家——影眸当年的第一个技术成果“穹顶光场”,目前已经成为全球影视和游戏领域一个成熟的商业化3D采集方案。即将上线的某款期待值极高的国产3A大作,就使用了由穹顶光场拍摄的全套角色脸模。因此他们看得清水的深浅。

打开网易新闻 查看精彩图片

另一方面,虽然千万面的高模不可能直接放进游戏,但是把高模阶段的生成品质拉得足够高,实际上也是为整条管线的后续流程打开新的机会。

比如,高模阶段面数拉到上千万面,才有机会让毛发、叠层布料、建筑雕花等复杂元素清晰地在AI模型里展现出来,才有机会让AI真正触及3A级高精写实资产的生成。也正如吴迪介绍的,用户可以使用Rodin Gen-2.5将高模表面的高清材质在转为低模后烘焙成法线贴图,以较低性能消耗换来较高观感。模型本身的能力爬上更高台阶后,即便不直接生成最终资产,也能减少后续低模制作和细节补足的时间消耗。高模生成不是终点,而是AI 3D进入游戏工业流程的第一块踏板。

这也解释了为什么在高模阶段确保模型形态正确、把贴图质量拉高到3D原生级,实际是在回应AI 3D模型的传统痛点——只要生成品质不过关,牵动的就是后续一连串人工修改流程。如果贴图的颜色、阴影、高光、污渍、材质细节全都糊在一张图里,贴图师很难干净地调整;如果模型布线太乱,最后可能还不如重新手工制作。

而这其实也引出了行业最关切的问题——AI 3D建模什么时候才能真正走向Production-Ready(可用于生产)?

02

跨过“生产”的那条河

而这实际上也是影眸最关心的问题。

吴迪讲述了一个经历:当年影眸研发第一代穹顶光场,对它的打光结果相当自信,结果实验室的数据格式和影视工业的标准不互通,根本没企业买单。吴迪说,这段惨痛教训让他们把Production-Ready写进公司理念里——科研和产业在河的两岸,过河的过程可能会落水、呛水,必须心存敬畏。等到了做Hyper3D Rodin,他们一直直接从客户那里接收真实反馈,并据此迭代产品。

他们总结了游戏公司客户的需求,“往高模走,就要让表面生成更多正确、有用的细节;往最终游戏阶段走,就要有好的拓扑结构、布线正好在转角处、UV展开利用率要高、PBR 材质要分层、分件要好——这些都是(游戏公司)客户传导给我们的观念。”

不过,Hyper3D服务的也不只有游戏行业。3D打印关注模型的水密性,工业设计关注格式、尺寸和标准,影视特效则对材质、精度和管线适配有另一套要求。累计起来,这是一个很难面面俱到的难题。

Hyper3D的核心思路,是围绕“可控性”切入专业3D生产,让专业用户自己决定需要的Production-Ready是什么样,并把这种需求体现在Rodin模型生成界面的各种预设上。

如果说消费级AI产品追求的是一键出图,那么专业级AI 3D产品最重要的,反而是让用户有足够多的地方可以“插手”。

Hyper3D今年上线的“3D编辑”功能,就是一个能体现他们如何做可控性的直观例子——模型生成后,如果用户只对某个局部区域不满意,可以直接将其框选,然后局部重新生成,避免因为一个小瑕疵而反复重新“抽卡”。

打开网易新闻 查看精彩图片

给出局部编辑指令:“把车头变成跑车”

张启煊和吴迪挺自豪:这个技术目前还没有业内产品跟得上。Hyper3D团队能攻克它,是因为他们是3D AI大模型公司里第一个提出、也是目前少数掌握3D ControlNet可控生成架构的团队。实质上,这套能力要解决的是生成一致性问题,即在局部修改的同时,确保其他部位保持不变。

同时,这也要求3D模型本身能够像图片和文本一样作为模型输入。实现这件事所需的3D理解器,则来自他们更早研发BANG分件生成功能时积累下来的能力。包括Hyper3D之所以能够在Rodin Gen-2.5时拿出领先的外观模型,也与穹顶光场在材质扫描上的长期积累密切相关。

打开网易新闻 查看精彩图片

BANG分件

不难看出,影眸很擅长利用他们最核心的优势——钻科研、卷前沿研究,拿出原创性的技术成果,再回到3D模型生产的第一性问题上。这些技术逐步滚雪球式积累下来,在长线形成杠杆,并在服务真实生产时撬动更高收益。

张启煊表示,他们可能是目前为数不多能够提供从生成前控制、生成中控制到生成后控制的3D大模型产品的团队之一。也正因为如此,专业付费用户才愿意深入探索这个模型,并找到最适合自己的设定。

外界能看到的是,从攻克材质关、精度关开始,Rodin Gen-2之后,影眸科技又逐步探索“智能低模(Smart Lowpoly)”等功能。显然,他们希望未来的Hyper3D Rodin系列模型能够持续服务好游戏等实时3D场景的开发者。

打开网易新闻 查看精彩图片

同一模型经过智能低模降面数后对比

从Reddit等论坛的用户反馈来看,这些功能目前生成的低模质量已经相当可用。甚至Hyper3D Rodin也采用了“按交付收费”的思路,在用户满意前,模型可以免费重新生成和局部编辑。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

他们也把Hyper3D Rodin插件接入了Blender、虚幻、Unity、Godot等大部分主流3D软件,让创作者可以在专业软件中一键调用资产,甚至用Hyper3D Rodin编辑其他AI平台生成的模型。这些动作背后,都是同一个目的:让Hyper3D Rodin更深地嵌入真实生产。

当然,吴迪和张启煊也不避讳谈及他们目前面临的一些挑战。比如Rodin在UV等方面尚未完全攻克,模型的拓扑布线对高品质内容型游戏来说仍然不够精致。背后的原因很多,既有实际游戏项目优质数据不足的问题,也有3D模型本身远比图像、文本更复杂的特性。

但二人也一致表示,像分件、材质、拓扑、UV这些每一家游戏公司都会提的共性要求,必然会排在靠前的研发优先级里。

这些能力看似是模型从高模到成品的“最后一公里”,但实际也与AI 3D能否打通游戏开发全流程息息相关,这也是这个领域未来一两年最值得关注的进展。

03

向未来

在访谈的最后,我们也与两位创始人聊了聊目前整个3D生成领域的发展现状。

我的感受是,整个AI 3D生成领域有点像一个时间胶囊,它不断让我想起2024年前后LLM大模型飞速发展的阶段——人们热议Scaling Law和预训练参数量,基座模型本身还没有触及瓶颈,模型能力的提升还能直接为用户体验带来增益。产品化的下一阶段竞争还没有全面开始,而Rodin Gen-2.5在生成能力上的进步,已经能显著帮助AI 3D往管线更深处渗透。

对此,吴迪也有他们自己的判断。如今获得新的融资后,影眸也有了新的燃料,可以投入更高强度的科研。按照吴迪的预估,三年后的Hyper3D大概率仍然会聚焦在专业领域。在未来一两年,他们主要做两件事:一是继续精进底层模型的生成质量;二是在未来的Hyper3D Rodin里拓展编辑、Agent化等能力,让模型在专业领域越来越好用,同时让Rodin能够接入生产制造的战略模型设施。

不过这也是一个出乎意料朴实的回答。毕竟全球范围内,围绕AI 3D相关的团队,许多团队都在向更容易吸引投资人的热词靠拢:世界模型、下一代UGC互动生态底座、3D内容平台……但张启煊很坦然:他们当然对世界模型感兴趣,但整个团队技术出身,对这个概念有更多敬畏。

到了下半年,影眸会发布一个场景级生成模型。但在目前这个阶段,它还不满足吴迪对世界模型的严谨定义——能被操纵,能服务具身智能控制,并且真的理解整个世界。不过他们也相信,这类技术会是未来通向世界模型和具身智能的重要基础。

打开网易新闻 查看精彩图片

所以在可见的未来,影眸的愿景依然很明确:做好那个服务专业3D人的工具。他们要做的,是让建模师手里的工具变得更锋利。

这可能也是AI 3D在游戏行业最现实、也最值得期待的路径。

它不必一上来就颠覆整条3D管线,也不会马上替代成熟建模师的全部工作。更重要的是,它正在从最前端、最重复、最耗时的环节开始,一点点把人从繁重的体力劳动里解放出来,让创作者把更多精力重新放回审美、判断和表达本身。

对游戏行业来说,3D生产长期是一条又深又窄的河。过去只有少数资金、团队和经验都足够充裕的公司,才能稳定抵达更高品质的彼岸。而AI 3D真正值得期待的地方,或许就在于它正在悄悄拓宽这条河上的桥。

当更多中小团队、独立开发者,乃至普通创作者都能更低成本地触达高品质3D资产时,游戏世界里的想象力,也会拥有更多真正落地的机会。