5月23日,36氪在北京举办了「颠覆·AIGC」产业发展峰会。本次峰会汇聚产业力量,共同探讨企业、行业在面临变革时的应对策略,分享思考,探索和发现产业中最具潜力的企业与最具价值的技术,在激荡的环境中探寻前行的方向。

会议中,小库科技CEO何宛余发表了题为“泛建筑设计领域的AIGC创享之路”的主题演讲。

打开网易新闻 查看精彩图片

小库科技CEO何宛余发表了题为“泛建筑设计领域的AIGC创享之路”的主题演讲

何宛余首先解释了什么是“泛建筑设计领域”,她介绍:泛建筑设计是一个很广阔的领域,包括城市规划、建筑设计、园林景观和室内装饰。总的市场规模在国内大约是9100亿,全球约6.7万亿,是一个非常巨大的市场。

小库科技认为:人工智能加人一定是大于人本身的存在。在这样的路径下,对于泛建筑设计领域来讲,AI可以帮助人同步提升质量和效率。

何宛余展望道:万亿级的泛建筑设计领域(规划、建筑、室内、景观等)急需质量与效率十倍提升。这有赖于AI+人>人。小库AI云一站式泛建筑AIGC创享平台,是基于千万级泛建筑数据的自研大模型,精准可控地生成设计意向,实现“零门槛生成”、“无障碍炼丹”、“无缝接工作流”。

以下是小库科技CEO何宛余的演讲实录(经36氪摘编):

大家下午好!

非常荣幸有机会和大家进行分享,我们在泛建筑设计领域关于AIGC的一些创想路径,前面即时设计的朋友在交互设计领域讲了很多有益的探索。

而什么是泛建筑领域?泛建筑设计是一个很广阔的领域,包括城市规划、建筑设计、园林景观和室内装饰。总的市场规模在国内大约是9100亿,全球约6.7万亿,是一个非常巨大的市场。

在这个万亿级的市场里面我们是怎么去工作的呢?其实完全是靠人,靠人的经验、人的时间,再加上一系列的传统工具来实现。在这个领域里面,也出现很多如“卷”、“耗”、 “熬”这些词汇。因为泛建筑设计师的工作非常繁重,不仅需要对一个想法进行系统设计,也要用一个画稿去实现,且还有更多工作是如何把这些东西逐渐转化为和现实世界结合。

要解决设计师们的核心痛点,关键是要去解决质量和效率,而且是在质量效率增强的情况下,我们不去增加成本,甚至降低成本。但如何去实现质量和效率10倍甚至100倍提升?这是我们行业面临下一个阶段升级的核心议题。

这种升级如何实现?实际上就是通过人工智能。我们相信,人工智能加人一定是大于人本身的存在。在这样的路径下,对于泛建筑领域设计来讲,AI可以帮助人同步提升质量和效率。

小库科技2016年成立,2017年的时候,我们已经在探索如何用卷积神经网络在地图上生成建筑规划设计。比如说每一个地块怎样通过AI来生成,而且成果还能够进一步被编辑和输出;在2018至2019年我们也开始用对抗网络生成一系列的建筑意向,也可以自动设计生成房子的户型。2019到2020年,我们进一步探索如何把图形和图像结合,人在左边草图,右边机器可以生成建筑意向,当时图像还比较模糊。2020到 2021年时用图像生成图形,这个图形是精准可编辑,也可以进一步生成三维模型,在这样的情况下我们把建筑领域知识和AI生成,以及图像模型控制,进一步实现在产业领域应用。

到了2022年,我们开始用文字生成建筑图像,把我们常年积累的数据库特别是中文语料、建筑标签标注等跟图像数据进行结合,可以在中文语境下生成建筑的意向。比如我们讲了一个建筑大师Zaha Hadid代表未来风格建筑逻辑。但通用的大模型对这个词没有什么反应,然而通过我们的垂直领域数据训练,可以生成这样的未来主义建筑风格。因此,可以看出,AIGC除了大模型之外,其实在每个垂直领域落地变得尤为重要。

我们小库有7年积累下来的ARCHINET作为最重要的数据库,它由千万级的泛建筑的数据,里面包括我们刚才提到的城市规划、建筑设计、景观园林、室内装饰一系列的领域。它有结构化标签数据和中文语料,在这个基础之下我们通过大量算力的训练,以及在深度学习算子层级进行优化,实现三个我们自己的图像大模型:小库建筑大模型、室内大模型、泛建筑包罗万象大模型。

我们将自研的大模型和实验失败的一些过拟和模型进行了对比,比如针对于这一组提示词:“住宅、高层立面图、现代主义风格”。其实这个过拟合模型在这一组输入下,和我们生成效果差不多,因为过拟合模型可以对一个非常精确的东西进行直接生成。但是再看看后面,如果加入新词,过拟合模型并没有反应,而是每次生成效果差不多的东西;而再看看小库大模型,如果输入新中式风格或者人示图、半鸟瞰、未来风格等词都会对这样一些新的输入题词进行一系列的反应。这就是垂直领域模型和过拟合模型在专业细节上的区别。

因此,基于小库大模型我们打造一个全新产品,今年5月初发布,叫小库AI云,一站式泛建筑AIGC创想平台。包括生成、训练、共享三大板块。

打开网易新闻 查看精彩图片

小库AI云

  • 第一个核心内容「生成」有两种模式,一个是通过文字生成图片,另一个通过图片、图形生成进一步的图像,这几种方式都比较常见,在我们这个领域有独到优势;
  • 第二块「训练」,大家知道我们在建筑领域或者在视觉领域,除了直接生成,还可以安装一套系统,部署环境用自己的数据集训练,但是这个门槛非常高,对于普通设计师来说基本不可能搭这么复杂的环境。对于大多数人讲,不仅希望用到生成,也希望自己能够训练自己的模型,进一步用到自己的工作领域,我们也在这里给到模型训练能力;
  • 第三块「共享」,用户可以把训练成果以及生成成果进行分享,在我们平台上面进行发布共享。

举例来说,在一个典型的工作流中,我们针对于不同建筑类型和要求都可以做出很多反馈,整个系统我们是用在云端,只要通过clould.xkool.ai进入。在「生成」模块,AI生成的成果,原本需要建筑师独特的设计和审美能力,花好几天时间。而这里,只需要调用大模型,输入需求相关的建筑词汇,10秒钟就能得到出乎意料的结果。这里一个重要细节可以注意一下,建筑的线条到底直不直,是模型可用度非常重要的标志,不是很混乱模糊东西,是非常精准的产出。

在这里还有一个有别于现有海外产品的重要功能: LoRA叠加。通过各种LoRA小模型可以实现不同风格,用户自己训练或者选择别人的模型进行调用。比如说手工模型风格,或者亚克力模型风格。通过“图生图”,可以通过上传一张参考图,复制我们在灵感广场看到觉得不错图片的提词和参数,直接能把数据复制到输入中,自动生成一系列和刚才参考非常相似的输出。再比如,上传一张拍摄的室内毛坯空间,输入需求,也可以针对这张照片生成一系列成果。

对于设计师更多的场景是精确的生成和渲染,比如我想把手绘草图变成某个特定的建筑风格。可以通过上传草图,输入需求,然后生成。简单3步就可以得到,基于草图非常精确、非常清晰的结果。同时,我们还可以针对于生成的图像进行编辑,比如说我对这个建筑的入口不太满意,想对入口进行一系列的改变。我们可以直接涂抹掉入口这部分的空间,然后对入口进行新的生成,输入你的需求,进一步生成你想要的入口效果。这个过程可以不断地进行,我们这里也可以再次把入口换成木材,看看会生成什么样的效果?如果对整个这一栋建筑都不满意,只是觉得周边环境还不错的话,就把主建筑涂抹掉,换成一个可能更不同一些设计的方案,比如说更曲线未来风格的建筑,也可以马上实现这种可能性的测试。

以上这一系列的动作,都是基于泛建筑设计师的创作场景去实现的。除了生成之外,还可以用图像素材去「训练」模型做Fine Tuning。只需要上传建筑类的图像数据,做一个简单的参数设置就可以就开始训练。可能你搜集素材花了10分钟,上传和设置花了1分钟,最后只需要再通过10分钟的极速云端训练,马上可以得到一个属于自己的模型。

在生成成果和创造工具后,设计师们可以做进一步的共享和分享。目前我们在灵感广场和模型市场中不断有用户生成并共享创作的内容。普通用户进来也可以看到大家的生成参数什么样,可以学习提升自己对生成质量的控制。或者直接调用其他炼丹师上传或生成的模型,去做这样的模型。

在灵感广场中不仅可以看别人做的,还可以通过一键生成同款,就可以得到跟别人差不多但是又不完全一样的内容。在模型集市上,用户可以对其中的模型进行调用,我们可以选择不同的LoRA的权重比例,通过不同小模型的叠加,去实现自己的成果。

另外我们也做过很多测试。比如同一组输入提示词与MidJourney的对比。可以看到下面的MJ效果其实对于建筑来说是非常夸张的,这个颜色和形态都与泛建筑类设计师在真实工作中想要效果相差比较远。或者另一组提词,针对曲线的效果,更是差的比较多了。可以看到下面MJ颜色都是比较接近梦幻二次元效果,而上面小库的效果是泛建筑设计师们比较喜欢的风格和比较统一的体量关系。[动画表情]

打开网易新闻 查看精彩图片

小库AI云与MidJourney的对比示意

再比如,我们也跟Stable Diffusion做了比较。比如跟刚才同样的一组输入,因为SD的底层非常的基础,基本达不到任何想要的生成结果。但是我们在泛建筑的领域里面,我们自己大模型针对于建筑做了非常多的预训练,可以看到在SD整个层面上不同的提词反馈不太精确,但是小库生成的效果在这里非常精准表达了用户想要的内容。

总结对比来看,小库生成和训练层面都吸取国外AIGC产品的优势,并有效地避免了他们的劣势,成为能让到中国的泛建筑设计师低门槛高效产出优质成果的产品。

打开网易新闻 查看精彩图片

小库AI云产品对比示意

未来我们还会做什么事情?

因为小库过往积累了针对建筑领域各个设计环节的AI能力,我们正将小库的工具矩阵与小库AI云进行有机结合,这个结合不是指生硬的跳转链接,而是会用全新的ChatBot调动小库的AI能力APP,去重建并完成一系列的工作流。

如与小库机器人对话,比如输入想在广州做一个住宅的需求。AI会给出建议的户型,然后调用「小库设计云」里面“智能单体”APP,可以对这个户型进行编辑和设计,并进一步生成三维模型。通过这个模型,可以再调用小库AI云的生成功能,进一步生成这个模型上的我们希望的方案。再进一步还可以生成对应CAD图纸和三维模型。

这一系列工作的时间不到一个小时,以往需要10天左右和多个不同团队去实现的整个工作流,被小库AI重塑。不仅可以让设计师在上面反反复复推敲找寻最优方案,也可以让设计和沟通在机器协助下变得非常高效。同时,还可以把成果从一个意向变成一个实实在在能落地的设计方案。

我们在其他泛建筑领域还有更多应用空间,希望有机会可以和更多朋友们一起携手探索。比如我们在室内领域里,有一个室内毛坯效果,拍照以后立刻生成室内装饰效果。或者是在上传户型图后,一方面可以对户型进行评估,另一方面又可以生成用户想要的一系列室内设计效果。

当前,小库AI云是设计工作流的概念切入,因为AIGC在泛建筑领域的产出比较偏概念、偏形态、偏造型风格内容。但是当这个能力与小库其他能力:图形设计、模型设计、建筑专业等领域知识结合时,我们就已经可以看到,小库设计云是一个能够覆盖整个泛建筑设计领域全过程的平台。它产出的成果,可以与前策划阶段打通,也可以与后评估,甚至实施阶段打通。使得小库AI云的成果不再只是泛建筑领域的一个方案或想法,而是真正能从方案想法到实际落地应用的设计方案。

以上,是我们对泛建筑设计领域AIGC的创享探索。总结来说,小库AI云就是一个零门槛生成、无障碍炼丹、无衔接工作流的一站式AIGC创享平台。