游戏行业最“苦”的领域，离被AI解放更近一步了？|低模|游戏|高模

文/熊莫

导语

国人团队做AI 3D，拿下数亿融资

“头部3A大作里用过的高精古建扫描资产，在可见的未来就能被AI部分替代掉了。”“新模型发布后，我们的订阅用户和ARR环比增速翻了四倍。”“目前最大的一家游戏公司客户，每年给我们付费百万美元。”

前几天，茶馆君受邀前往影眸科技位于上海的办公室，观看了他们前阵子发布的最新AI 3D模型Rodin Gen-2.5的效果演示，并和两位公司创始人CEO吴迪、CTO张启煊深入交流了一番，于是便有了以上这些对话。

今年GDC期间，影眸科技的展台

从年初开始，茶馆君就一直在密集关注AI在游戏3D生成领域的进展。原因说来可能有点奇怪：因为它的进化来得有点“太慢”了。

你看，Claude Code、Codex、Seedance、Suno这些工具一批批成熟，AI基本已经把游戏行业各个岗位的日常工作方式改了个遍。2D美术、文案、程序，乃至买量投放，都在经历程度不同的重塑。

唯独3D美术，一直像是AI战线稳步推进过程中的一处豁口。直到几个月前，我和美术朋友聊起这个领域，最前沿的几款AI工具也还大多停留在“只能预览、没法交付”的状态——要么是把AI生成的模型放在关卡白模里看看效果，要么是在2D概念转3D建模时大致做个参考。那时AI生成模型还没有迈过可用门槛；而后续拓扑、展UV、刷权重这些真正的“苦力活”，仍然需要美术人员亲力亲为。

这也是AI 3D最让行业纠结的地方：它看起来离游戏很近，真正进了管线，又总是差了几步。

而现在，有一群人在试图补上这段差距。作为国内深耕AI 3D领域的头部企业之一，影眸科技刚刚新一轮数亿元人民币融资。本轮融资由凯辉基金、上海国投先导领投，老股东持续跟投。他们没有刻意去讲世界模型、具身智能的宏大叙事，而是更专注于做一套足够好用的工具：形成AI 3D创作的全套工作流闭环，把垂直场景里的真实生产需求一层层打透。就这样一路做到数千万美金的ARR。

尤其是在看到Rodin Gen-2.5的实际效果后，我觉得它主打的全球首个千万面超高精度生成、12K高清材质、原生3D纹理等特性，已经能够在游戏3D建模工作流中扮演一个足够有意义的角色。

乃至于，距离游戏3D管线像其他领域那样被AI系统性改造，可能真的只剩下一到两次关键迭代了？

游戏3D的第一步，终于走稳了？

在此之前，“技术派”是外界对影眸科技具有的印象——他们是上海科技大学实验室孵化出来的初创公司，连续多年获得过国际图形学顶级会议SIGGRAPH最佳论文及提名，算法团队每两人中就有一人获得或提名过最佳论文。乃至于，目前AI 3D行业集体使用的3D原生生成框架CLAY最早就是由影眸在2024年提出——他们是整个行业发展拐点的缔造者。

成立公司后，他们一直在从学术界向产业界走。到了今年，Unity在GDC现场演示Unity AI Beta、网易在《蛋仔派对》《燕云十六声》里为UGC做实时资产生成，乃至英伟达创始人黄仁勋在CES现场做机器人主题演讲，都直接使用了影眸的Hyper3D Rodin模型。吴迪透露，目前影眸数千万美元的年ARR中，有约一半由B端大客户贡献，续费率几乎达到100%。

而这样一个团队端出的最新成果Rodin Gen-2.5，究竟有哪些亮点？直接看表现。

上传一张参考图，经过数秒到数十秒的可控时间即可生成模型。整体结构比例稳定，不容易走样，对卡通、魔幻、写实等不同风格都能够较好掌控。而和以往我们印象里的AI 3D模型最大的不同之处在于，即便把模型缩放到最大仔细审视，也不那么容易找出破绽了。

皮包上的牛皮纹路、人脸上的汗毛、褶皱，乃至虹膜这种微结构，都清晰可见。硬表面足够硬，几乎没有发软的边缘和模糊的线条——这种近乎人工精雕级别的精度，是直接体现在模型层级上的。至少在观感上，它已经明显不同于过去那些“远看还行、近看崩坏”的AI 3D模型。

张启煊解释道，这是Rodin Gen-2.5以最高档位Extreme-High搭配Micro微观模式生成的效果，整个模型生成时间大约80秒，精度高达千万面，在当下处于全球第一梯队。与此同时，他们还提供了五档精度生成选项，就像语言大模型的不同思考深度一样，通过可变token和不同生成时间，输出不同精度、不同面数的模型，最低档模型只需4秒即可快速生成百万面级模型。

Extreme-High用于高写实场景，其他档位则可以覆盖风格化卡通模型、小型物件、UGC预览等更多层级的需求，让用户根据不同生产场景自行选择。这其实是AI 3D走向专业工具的一个重要变化：模型不再只追求单一维度的“更清晰”，而是开始把选择权交还给创作者。

Gen-2.5的另一项新特性，也是冲着3D生成模型的能力死角去的——它首次搭载了基于3D原生生成的外观生成模型。

以往AI模型做材质生产，通用方案是投影法，即用多角度照片合成材质贴图，缺陷很明显：颜色断层、PBR材质不准确、凹陷区域照不到、不同材质容易串色。比如头发颜色跑到皮肤上、金属质感被误判成普通漫反射，都可能导致模型在后期无法直接使用。

影眸则自己训练了一个新的外观模型。据张启煊介绍，其难度几乎比肩从零训练一个图像生成模型，换来的是贴图和模型更贴合，材质品质也更稳定：金属、木头、皮革的不同光泽，乃至材质上的Logo和文字，都可以相对准确地生成。

超高精度加上原生贴图，二者结合实现的效果其实传递出一个很强的信号：如今像Hyper3D Rodin这样的AI模型已经越过生成品质线，超越单纯“生成得像”的阶段，能够拿出在特定环节里可交付的资产了。

游戏的3D管线往往以高模为起点，百万面乃至千万面的高模，需要经过重拓扑、展UV、减面、拆件、烘焙等一系列环节，最终成为可在游戏内运行的形态。张启煊表示，影眸的客户里，一些中小型公司已经会直接将低模用于最终游戏成品；而更多海内外游戏工作室，则已经把Rodin Gen-2.5用在高模阶段。

原本需要雕刻师精雕数日、数周的大型模型，如今几分钟就能迭代出好几版，再选出最好的结果送去进行后续处理。

当然，“降本增效”已经是AI领域的老生常谈。相比之下，我觉得Rodin Gen-2.5更重要的意义在于，它让AI 3D模型在游戏管线里完成了一次从“不可用”到“局部可用”的跨越。

比如文章开头提到的张启煊的判断，像《黑神话：悟空》里用到的一部分扫描资产，未来都可以使用AI高效生成，并在一定程度上替代。凭借Rodin Gen-2.5这样的模型，使用高精度资产的机会，可能从行业里极小一部分人，扩展到更多中小团队和普通开发者手中。

况且影眸自己本来就是3D扫描领域的专家——影眸当年的第一个技术成果“穹顶光场”，目前已经成为全球影视和游戏领域一个成熟的商业化3D采集方案。即将上线的某款期待值极高的国产3A大作，就使用了由穹顶光场拍摄的全套角色脸模。因此他们看得清水的深浅。

另一方面，虽然千万面的高模不可能直接放进游戏，但是把高模阶段的生成品质拉得足够高，实际上也是为整条管线的后续流程打开新的机会。

比如，高模阶段面数拉到上千万面，才有机会让毛发、叠层布料、建筑雕花等复杂元素清晰地在AI模型里展现出来，才有机会让AI真正触及3A级高精写实资产的生成。也正如吴迪介绍的，用户可以使用Rodin Gen-2.5将高模表面的高清材质在转为低模后烘焙成法线贴图，以较低性能消耗换来较高观感。模型本身的能力爬上更高台阶后，即便不直接生成最终资产，也能减少后续低模制作和细节补足的时间消耗。高模生成不是终点，而是AI 3D进入游戏工业流程的第一块踏板。

这也解释了为什么在高模阶段确保模型形态正确、把贴图质量拉高到3D原生级，实际是在回应AI 3D模型的传统痛点——只要生成品质不过关，牵动的就是后续一连串人工修改流程。如果贴图的颜色、阴影、高光、污渍、材质细节全都糊在一张图里，贴图师很难干净地调整；如果模型布线太乱，最后可能还不如重新手工制作。

而这其实也引出了行业最关切的问题——AI 3D建模什么时候才能真正走向Production-Ready（可用于生产）？

跨过“生产”的那条河

而这实际上也是影眸最关心的问题。

吴迪讲述了一个经历：当年影眸研发第一代穹顶光场，对它的打光结果相当自信，结果实验室的数据格式和影视工业的标准不互通，根本没企业买单。吴迪说，这段惨痛教训让他们把Production-Ready写进公司理念里——科研和产业在河的两岸，过河的过程可能会落水、呛水，必须心存敬畏。等到了做Hyper3D Rodin，他们一直直接从客户那里接收真实反馈，并据此迭代产品。

他们总结了游戏公司客户的需求，“往高模走，就要让表面生成更多正确、有用的细节；往最终游戏阶段走，就要有好的拓扑结构、布线正好在转角处、UV展开利用率要高、PBR 材质要分层、分件要好——这些都是（游戏公司）客户传导给我们的观念。”

不过，Hyper3D服务的也不只有游戏行业。3D打印关注模型的水密性，工业设计关注格式、尺寸和标准，影视特效则对材质、精度和管线适配有另一套要求。累计起来，这是一个很难面面俱到的难题。

Hyper3D的核心思路，是围绕“可控性”切入专业3D生产，让专业用户自己决定需要的Production-Ready是什么样，并把这种需求体现在Rodin模型生成界面的各种预设上。

如果说消费级AI产品追求的是一键出图，那么专业级AI 3D产品最重要的，反而是让用户有足够多的地方可以“插手”。

Hyper3D今年上线的“3D编辑”功能，就是一个能体现他们如何做可控性的直观例子——模型生成后，如果用户只对某个局部区域不满意，可以直接将其框选，然后局部重新生成，避免因为一个小瑕疵而反复重新“抽卡”。

给出局部编辑指令：“把车头变成跑车”

张启煊和吴迪挺自豪：这个技术目前还没有业内产品跟得上。Hyper3D团队能攻克它，是因为他们是3D AI大模型公司里第一个提出、也是目前少数掌握3D ControlNet可控生成架构的团队。实质上，这套能力要解决的是生成一致性问题，即在局部修改的同时，确保其他部位保持不变。

同时，这也要求3D模型本身能够像图片和文本一样作为模型输入。实现这件事所需的3D理解器，则来自他们更早研发BANG分件生成功能时积累下来的能力。包括Hyper3D之所以能够在Rodin Gen-2.5时拿出领先的外观模型，也与穹顶光场在材质扫描上的长期积累密切相关。

BANG分件

不难看出，影眸很擅长利用他们最核心的优势——钻科研、卷前沿研究，拿出原创性的技术成果，再回到3D模型生产的第一性问题上。这些技术逐步滚雪球式积累下来，在长线形成杠杆，并在服务真实生产时撬动更高收益。

张启煊表示，他们可能是目前为数不多能够提供从生成前控制、生成中控制到生成后控制的3D大模型产品的团队之一。也正因为如此，专业付费用户才愿意深入探索这个模型，并找到最适合自己的设定。

外界能看到的是，从攻克材质关、精度关开始，Rodin Gen-2之后，影眸科技又逐步探索“智能低模（Smart Lowpoly）”等功能。显然，他们希望未来的Hyper3D Rodin系列模型能够持续服务好游戏等实时3D场景的开发者。

同一模型经过智能低模降面数后对比

从Reddit等论坛的用户反馈来看，这些功能目前生成的低模质量已经相当可用。甚至Hyper3D Rodin也采用了“按交付收费”的思路，在用户满意前，模型可以免费重新生成和局部编辑。

他们也把Hyper3D Rodin插件接入了Blender、虚幻、Unity、Godot等大部分主流3D软件，让创作者可以在专业软件中一键调用资产，甚至用Hyper3D Rodin编辑其他AI平台生成的模型。这些动作背后，都是同一个目的：让Hyper3D Rodin更深地嵌入真实生产。

当然，吴迪和张启煊也不避讳谈及他们目前面临的一些挑战。比如Rodin在UV等方面尚未完全攻克，模型的拓扑布线对高品质内容型游戏来说仍然不够精致。背后的原因很多，既有实际游戏项目优质数据不足的问题，也有3D模型本身远比图像、文本更复杂的特性。

但二人也一致表示，像分件、材质、拓扑、UV这些每一家游戏公司都会提的共性要求，必然会排在靠前的研发优先级里。

这些能力看似是模型从高模到成品的“最后一公里”，但实际也与AI 3D能否打通游戏开发全流程息息相关，这也是这个领域未来一两年最值得关注的进展。

向未来

在访谈的最后，我们也与两位创始人聊了聊目前整个3D生成领域的发展现状。

我的感受是，整个AI 3D生成领域有点像一个时间胶囊，它不断让我想起2024年前后LLM大模型飞速发展的阶段——人们热议Scaling Law和预训练参数量，基座模型本身还没有触及瓶颈，模型能力的提升还能直接为用户体验带来增益。产品化的下一阶段竞争还没有全面开始，而Rodin Gen-2.5在生成能力上的进步，已经能显著帮助AI 3D往管线更深处渗透。

对此，吴迪也有他们自己的判断。如今获得新的融资后，影眸也有了新的燃料，可以投入更高强度的科研。按照吴迪的预估，三年后的Hyper3D大概率仍然会聚焦在专业领域。在未来一两年，他们主要做两件事：一是继续精进底层模型的生成质量；二是在未来的Hyper3D Rodin里拓展编辑、Agent化等能力，让模型在专业领域越来越好用，同时让Rodin能够接入生产制造的战略模型设施。

不过这也是一个出乎意料朴实的回答。毕竟全球范围内，围绕AI 3D相关的团队，许多团队都在向更容易吸引投资人的热词靠拢：世界模型、下一代UGC互动生态底座、3D内容平台……但张启煊很坦然：他们当然对世界模型感兴趣，但整个团队技术出身，对这个概念有更多敬畏。

到了下半年，影眸会发布一个场景级生成模型。但在目前这个阶段，它还不满足吴迪对世界模型的严谨定义——能被操纵，能服务具身智能控制，并且真的理解整个世界。不过他们也相信，这类技术会是未来通向世界模型和具身智能的重要基础。