CAD巨头Autodesk也在落地生成式AI了。

截至发稿,Autodesk(US:ADSK)股票2024年年内涨超20%,报293.32美元/股,总市值630.64亿美元。

"我们正在开发与任何模型都不同的生成式AI基础模型。"Autodesk 执行副总裁兼首席技术官 Raji Arasu 近日在出席一场公开活动时表示。Raji Arasu所说的基础模型,即2024年5月被曝出的名为“ Be​​rnini ”的生成式AI项目,该项目可将文本、手绘草图等转换成3D文件。

就当前的大模型市场来说,图生3D功能的实现似乎已经不是什么新鲜事。谷歌DeepMind刚刚发布的Genie 2、国内的腾讯混元以及生数科技的VoxCraft等等,都可以实现类似的功能。但是作为一家全球CAD巨头,Be​​rnini之于Autodesk的实际业务具有很大的现实意义。

揭秘Be​​rnini

Be​​rnini 以 17 世纪意大利著名雕塑家和建筑师 Gian Lorenzo Bernini 命名。在训练数据的选择上,该模型由 Autodesk AI 实验室与香港中文大学合作,基于 1000 万种公开可用3D形状进行训练。

之所以说Be​​rnini与其他基础大模型不同,是因为Be​​rnini在生成3D图像上有三大特性:

1. 生成3D图像结构为功能性 3D 结构。例如生成的水壶是中空的,真正具备装水的功能,而不仅仅是生成外观相似的模型; 2. 分离形状和纹理。能够分别生成形状和纹理,让使用者可以自由地调整变量,将它们融合在一起或进行其他设计,避免了将 3D 物体的纹理和轮廓混淆的问题; 3. 提供多种变体。特别针对专业几何工作流进行了优化,能够从单一输入生成多个功能性的 3D 形状变体,为设计师提供选择并加速其创意工作流程。

打开网易新闻 查看精彩图片

Autodesk使用界面截图

这其中,基础模型要实现上述特性需要克服设计、制造过程的天然障碍,即AI需要完全贴合设计工作输入输出的复杂逻辑。“接受多模态输入,如文本、草图、体素、点云,这些复制了创作者的设计过程。”Raji Arasu介绍。

此外,由于生成3D CAD 这样的几何图形需要基于物理定律的空间和结构来进行推理,对精度和准确性也提出了较高要求。

所以从时间上看,Be​​rnini的推出似乎算不上迅速。自2024年5月被曝出Be​​rnini进展到现在,已经过去大半年。彼时,Be​​rnini只是放出了一部分概念视频。而在10月份Autodesk在圣地亚哥举行的用户大会上,CEO Andrew Anagnost 才放出Be​​rnini预览版。

但Andrew Anagnost 表示,Be​​rnini用公开数据进行训练,目前还不能用于商业用途,已向AI社区开放。但是他也披露了Be​​rnini可能的商业计划:“训练Be​​rnini的方法是不依赖于数据的,所以客户在需要的情况下,可以使用自己的数据来优化Be​​rnini,不断改进这个模型。”

Be​​rnini是如何“炼”成的

Be​​rnini的训练过程也同样使用了英伟达GPU,但在GPU之外,Raji Arasu认为训练模型更为重要的是对“数据”的处理和使用。演讲中,Raji Arasu进一步披露了这一过程。她将构建过程分为数据处理、数据准备、兼顾成本与效率的模型训练和模型推理的复杂性管理。

“需要处理数十亿个不同大小、形状和工作负载的对象和 PB 级数据。”Raji Arasu表示。

Autodesk需要基于其海量的大型设计文件,来构建云端的数据底座,为此选择了Amazon DynamoDB 作为主要数据库并创建了一个规范数据模型,从而能够跨数百个分区进行写入,并具备高吞吐量和近乎于零的延迟。

在解决数据性能的基础上,Autodesk又通过结合Amazon EMR、Amazon EKS、Amazon Glue 和Amazon SageMaker等云服务轻松完成基础模型训练的数据准备流程,将大量复杂的历史数据进行了特征化、标记化和分词等操作。

在模型训练阶段,Autodesk也面临GPU选型等诸多问题,它最终使用了Amazon SageMaker 来统一解决实例测试、基础设施管理等,团队的更多精力放在了数据准备、模型开发以及面向客户的AI功能开发等方面。

在大规模模型推理管理时,需要妥善处理延迟、成本和性能表现。“Amazon SageMaker的自动缩放和多模型端点,无缝支持实时和批量推理,实现了高吞吐量、最小延迟和最大成本效率。”Raji Arasu表示。

可以看到,Autodesk构建Bernini的过程大量使用了Amazon SageMaker,这是亚马逊云科技最广为人知的人工智能和机器学习服务,包括Autodesk在内的很多知名企业正在利用其中的Amazon SageMaker HyperPod进行模型训练。Amazon SageMaker HyperPod在近期正式推出了几项重磅更新,如灵活训练计划可以创建更自动化的训练作业,通过高效利用各种更高性价比的计算资源来优化成本;以及任务治理功能,可以为不同的训练任务进行优先级排序,从而在模型训练、微调和推理过程中最大化资源利用率。

基于这些创新,Autodesk最终将基础模型部署时间缩短了一半。在保持运营成本稳定的同时,将AI生产力提高了30%。Raji Arasu也透露,Autodesk 已经开始向客户推出基于这些基础模型构建的AI功能

“作为客户的设计伙伴,帮助他们平衡参数,如材料强度、成本,以便他们能够确定最佳设计。所有这些都是为了最大限度地减少繁琐任务,最大限度地提高创造力。”Raji Arasu说。

数据正确,训练大模型的前提

ChatGPT之后,英伟达GPU成为各大AI公司追逐的热门标的,某大型公司一年订购多少张英伟达GPU甚至能够成为媒体的头版头条。不过,总结Be​​rnini的诞生过程,GPU固然重要,但数据决定了大模型训练的质量

而训练一个能够真正在业务中起作用的大模型,是一个涉及多方面的全栈系统问题。

“大模型只是生成式AI应用创新的一部分。生成式AI应用创新要做好的话,还需要其他能力的增强。首先需要确保生成式AI能用企业自己的数据来增强生成式AI应用的大模型能力。”亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松也在一次演讲中表达了类似的观点。

就拿大模型现在备受关注的幻觉问题来说,也可以从“元数据”的角度来着手解决,即在训练大模型之前确保知识库中的数据质量。“数据库中的元数据即被审查和批准的高质量数据,有助于减少延迟,提升大模型的响应。”亚马逊云科技技术副总裁 Mai-Lan Tomsen Bukovec表示,他提醒有正在进行大模型训练的企业,要注意分清哪些由人创建、哪些数据由人工智能生成。

正是由于数据的重要,大模型加速了企业数据资产的变现方式。2个月前,一家来自中国的3D空间设计平台酷家乐母公司群核科技也公布了新的商业计划,其面向具身智能等推出数据训练平台,开放全球最大室内场景认知深度学习数据集。这家公司披露,平台已经拥有超过3.2亿的3D模型,平均每月活跃访问者达7780万。该公司将面向AIGC、具身智能、AR/VR 等企业开放物理正确的3D空间数据资产、空间认知解决方案以及空间智能训练相关服务。

数据显示,约有77%的公司将在3年内增加或大力增加对人工智能和新兴技术的投资,人工智能将最先发生效率的3个方面分别是:Automation、Analysis、Augmentation(自动化、数据分析、辅助增强)。

“AI正在重塑所有行业”已经不再是一句口号。“越来越多的行业在生成式AI领域变得越来越积极。” 亚马逊云科技全球服务副总裁Uwem Ukpon表示,在生成式AI的行业应用领域,已从最开始的金融行业逐渐扩展各行各业,包括公共部门、传统行业、政府机构,以及生命科学和医疗等行业。与此同时,生成式AI也给各个企业提供了新的商业机会,Autodesk所押注的正是基于大规模数据的生成式CAD这个潜力巨大的未来市场。