本文刊发于《现代电影技术》2023年第5期
专家点评
近年来,有关人工智能生成内容(AIGC)的相关成果不断活跃于大众视野之中,人工智能技术取得广泛进展并运用于项目实践之中,创作出众多优秀作品。通过对大数据的不断学习与识别,人工智能逐渐具备理解相关影像语义的能力,在计算机视觉(CV)领域表现出强劲的发展势头,动画片《犬与少年》便是人工智能技术辅助设计的经典案例之一。《从动画影片〈犬与少年〉到元宇宙:AIGC的潜力、应用及挑战》一文以《犬与少年》这部商业动画片为案例,细致阐述AIGC技术协助创作人员设计并绘制动画短片中的相关角色、场景等,并展示AIGC技术在剧本创作、音频处理等方面的出色能力。AIGC技术集大成为一身,相关要素为其在元宇宙中的运用奠定基础,AIGC可以生成众多NPC角色,这种角色具备与玩家进行互动的能力,同时AIGC也能够完成剧情等方面的内容生成,借此可以构建起元宇宙中的虚拟社会。AIGC技术展现出前所未有的飞速发展趋势,并带来无限可能性。在面对这一新兴技术带来诱人的发展成果之时,我们也应当注重其对社会伦理、法治等方面带来的影响,客观辩证地看待AIGC技术,以确保相关人工智能技术能够促进社会健康有序发展,并取得更加深远的意义。
——丁友东
教授、博士生导师
上海大学上海电影学院党委书记、中国电影电视技术学会电影高新技术专业委员会副主任
摘要
随着人工智能技术的快速发展,人工智能生成内容(AIGC)已经成为当今创意产业发展的重要趋势。本文通过分析AIGC技术在动画影片《犬与少年》中的应用,试图探索AIGC技术应用于动画电影方面的潜力和优势。随后进一步讨论了AIGC技术在元宇宙领域的广泛应用可能性,及其在角色建模、动画渲染、场景构建等方面所带来的革新。同时,文章深入探讨了AIGC技术在发展过程中所面临的伦理、技术和市场挑战。笔者旨在为读者提供对AIGC技术潜力、应用及挑战的初步了解,为读者思考动画行业及元宇宙的发展提供若干启示。
AIGC;人工智能生成内容;动画制作;元宇宙;艺术设计
1引言
AIGC技术能够帮助动画师们快速地设计角色、生成场景,甚至编写剧本,以达到节省时间、降低成本的目的。随着AIGC技术的逐渐成熟,其在动画领域的应用是大势所趋,而随技术诞生的挑战也愈发严峻,包括但不限于其局限性、知识产权问题等。在这种背景下,探讨AIGC技术的潜力、应用及挑战成为一个亟待研究的课题。
元宇宙(Metaverse)作为一种将虚拟世界与现实世界紧密结合的新兴技术概念,正以翻天覆地的速度改变着我们的生活方式。AIGC技术在动画领域的成功应用为元宇宙的实现提供了可能,推动了元宇宙概念逐渐走向现实。因此,研究AIGC技术对动画行业及元宇宙的影响具有重要的理论与实践意义。
本文旨在通过分析AIGC技术在动画领域的成功应用案例——动画短片《犬与少年》来阐述AIGC技术在动画制作过程中的优缺点及其潜力应用和挑战。同时,本文将探讨AIGC技术如何为元宇宙的实现提供可能性,以及在元宇宙中的具体应用前景。通过深入研究这一主题,希望为动画行业和元宇宙的发展提供有益参考。
2AIGC技术的基本原理与应用案例
随着人工智能(AI)技术的飞速发展,人工智能生成内容(Artificial Intelligence Generated Content, AIGC)技术逐渐在各方面崭露头角。2023年1月30日,一部名为《犬与少年》的动画短片引起了广泛关注。该作品采用AIGC技术,大大降低了制作成本和时间,同时提高了作品的视觉质量。这一成功案例使得AIGC技术在动画行业及元宇宙领域受到广泛关注,为笔者的研究提供了一个有意义的切入点。
2.1 AIGC基本原理
AIGC技术是指利用人工智能生成和优化内容的一系列方法和技术。它结合了计算机视觉(CV)、自然语言处理(NLP)、生成式对抗网络(GAN)等多个AI技术,通过对大量数据的学习和模式识别,实现对各种类型内容的自动生成和优化[1]。计算机视觉技术使AI系统能够理解和解析图像信息,从而实现对图像内容的自动生成;自然语言处理技术让AI系统能够理解和生成人类语言,为动画制作提供文字描述、对话和剧本等内容;生成式对抗网络技术则是一种训练AI系统通过竞争学习生成逼真内容的方法,常用于生成图像、动画和音频等[2]。
以Runway公司和Wonder Studio为例,二者分别代表了AIGC技术在动画领域的不同应用。Runway利用文本生成视频(Text⁃to⁃video)AI模型Gen⁃2,用户可以输入描述,系统自动生成任何风格的对应视频。而Wonder Studio则专注于人工智能在影视制作中的应用,利用AI技术自动分析并捕捉真人表演,为CG角色制作动画并将灯光和CG角色匹配到实拍场景,大大提高了电影制作的效率和质量。
2.2 实例分析
《犬与少年》是AIGC技术辅助商业化动画片的首个发行级别作品,由日本奈飞(Netflix JP)、日本WIT STUDIO和微软小冰公司日本分部(rinna)联合制作。日本WIT工作室是一家知名的动画制作公司,制作多部受欢迎的作品;微软小冰公司则致力于人工智能技术的研究与应用。而本片导演是牧原亮太郎,他在片中负责故事和图画创作。
图1 《犬与少年》剧照
2.2.1 影片简介
《犬与少年》讲述了一位少年和一只可爱的机器狗偶然相识、相知的故事,他们的情谊跨越时空。影片的背景场景包括白雪皑皑的富士山、海边的小村庄、飘坠花瓣的樱花树和颜色浓烈的绿草地等,展现了一部典型、风格温馨的日本动画。
在这部作品中,绝大部分场景绘制工作是由人工智能完成的,而人物和动物角色——少年和机器狗则是通过传统的动画片制作方式,即手绘的方式完成。这种结合了人工智能和传统动画制作技术的作品,展示了动画产业在技术创新方面的尝试和发展。
2.2.2 创新表现
在《犬与少年》这部动画短片中,AI技术的运用在背景绘制和背景音乐生成方面展现出了显著的创新成果。
首先,该作品采用了一种名为“原始人工智能”的定制系统进行该片的背景绘制,该系统通过利用制作I.G的Netflix原创公司的背景艺术数据集进行训练。在这一协作式的背景艺术创作过程中,动画师首先向AI系统提供提示和布局,接着AI生成相应的图像,最后由动画师加以调整并与其他元素融合。这一迭代过程为团队提供了实现动画中所需场景外观和感觉的高效方式。此创新方法还为AI在未来项目中对角色设计等其他方面的贡献提供了潜力。
其次,在背景音乐生成方面《犬与少年》的制作过程中采用了名为“M”的AI代码,为主题曲“ainouta”(情歌)的创作提供了协助。通过分析大量现有音乐作品,理解各种模式、结构和风格,该组AI代码可以生成多个主题选项。之后,人类作曲家对这些AI生成的选项进行改进,为动画创造了一个具有凝聚力和吸引力的主题。这种合作方式展示了如何将人工智能融入传统音乐作曲工作流程,激发新想法和创新表达。
通过在背景绘制和背景音乐生成方面引入AI技术,《犬与少年》展现了动画制作领域的创新表现。这些创新应用不仅提高了工作效率,降低了成本,还充分发挥了动画师和音乐制作人的创造力。在此后的第2.3节中,我们将继续探讨如何将这些技术与动画制作相结合,以期在未来的动画产业中实现更多令人兴奋的突破。
2.2.3 存在的不足
AIGC技术的应用虽然极大地缩短了《犬与少年》制作周期和降低了制作成本,但在实际应用方面也存在一定的局限性。其一,在人物和动物角色设计方面,AI生成的图像质量与手绘相比仍有一定差距,其质量相对粗糙;其二,《犬与少年》中的少年和机器狗角色仍然采用了传统的手绘方式。在故事编排和剧情发展方面,AI暂时无法完全替代人类创作者的创意和想象力,本片中,故事情节仍然由人类导演和编剧负责创作。总的来说,《犬与少年》展示了AIGC技术在动画制作中的潜力和优势。尽管这一技术仍有待发展完善,但它无疑为动画电影产业带来了创新和可能性。该片在多家视频网站正式发行也意味着人工智能技术在动画制作领域逐渐开始商业化落地。
2.3 AIGC在动画领域的应用潜力
《犬与少年》中AI被用于背景的绘制、音乐的创作,但AIGC技术在动画领域的应用不止于此,包括但不限于以下几个方面:
(1)角色或场景设计
AI绘画可以很便捷地帮助创作者设计出想要的角色。AI可以大幅减少动画绘图的时间,并按照指示在3分钟内生成100张图片(4K分辨率),在单位时间内,AI生成草图的数量可以轻松超过人工手绘的极限。截至目前,在画师中运用较为广泛的模型有三款:DALL·E 2,由OpenAI开发,具有“Inpainting”特性,适合寻找灵感;Midjourney,生成的图像风格独特,具有插画感;Stable Diffusion,一个开源的AI绘画工具,快速生成能力令人惊叹。
(2)角色建模
通过AI技术,如英伟达(NVIDIA)的GauGAN360,可以自动生成或优化角色的外观、动作和表情等,减少动画师在角色设计和建模方面的工作量。一个应用实例是用AI生成的游戏角色,如游戏《赛博朋克2077》(Cyberpunk 2077)中大量的NPC角色均由AI生成[3]。此外,MetaHuman Creator是一个基于云端的应用程序,可以快速创建逼真的虚拟人物模型,广泛应用于游戏和动画制作[4]。
(3)场景构建
AIGC技术如Promethean AI可以辅助动画师完成复杂的场景构建,包括自动生成逼真的背景、物体和光影效果等。GET3D是NVIDIA最新发布的模型,通过2D图像训练后,该模型可生成具有高保真纹理和复杂几何细节的3D形状。比如,椅子腿上的各种轮子,汽车的车轮、灯和车窗,动物的耳朵、角,摩托车的后视镜,车轮胎上的纹理[5]等。ControlNet的模型则将AI绘画水平推向了新高峰,利用ControlNet工具,同样可以实现生成3D模型。此外,AI还可以用于生成逼真的天气和自然现象,如雨、雪、火等,为动画作品增添更多生动的细节。这些效果可以通过AI模拟,以提高场景真实感,同时节省动画制作过程中的时间和资源。
(4)剧本生成与对话编辑
利用自然语言处理技术,AI系统可以生成剧本和对话内容,协助编剧和动画师完成故事创作,如OpenAI的GPT-3。2016年的短片《阳春》(Sunspring),其剧本便由AI生成。在这方面,还有基于AI的文字冒险游戏AI Dungeon,可以根据玩家输入内容自动生成故事情节[6]。此类技术在动画领域的应用,有望帮助创作者更高效地探索创意和故事线索。
(5)音频处理
通过AI技术,可以自动生成音乐、音效和语音,为动画作品提供丰富的音频内容,如OpenAI的Jukebox。举一个AI生成音乐的案例,如AIVA(Artificial Intelligence Virtual Artist)所创作的音乐。此外,谷歌的Magenta项目利用AI生成音乐以及Adobe的VoCo技术,可以根据现有音频合成逼真的语音[7]。
毋庸置疑,AIGC技术能够在多个方面提高动画制作的效率与质量。《犬与少年》的问世体现了该技术在动画制作领域取得的初步成功,更为元宇宙概念的实现提供了可能。
2.4 AIGC技术在元宇宙建设中的应用前景
元宇宙(Metaverse)是一个虚拟的、数字化的共享空间,其中包含了多个相互连接的3D虚拟世界。元宇宙中,用户可以与他人互动、娱乐、学习和工作。随着互联网和虚拟现实技术的发展,元宇宙逐渐成为一个热门话题。通过之前对AIGC在动画领域的应用分析,我们可以发现AIGC技术在元宇宙建设中具有巨大的潜力,主要体现在以下几个方面:
(1)虚拟世界的创建:AIGC技术可以协助开发者自动生成丰富、多样的虚拟环境,包括地形、建筑、植被等,大大降低了虚拟世界创建的难度和成本。MetaHuman Creator允许开发者快速创建逼真的人类角色,缩短制作时间。前文提到的NVIDIA的GauGAN也可以根据用户输入生成自然场景,为虚拟世界提供更多可能性。
(2)角色生成与定制:AIGC技术可以为用户提供更加丰富、个性化的虚拟角色定制选项,包括面部特征、服装、动作等。通过AI技术生成的角色更加真实、多样,提升了用户在元宇宙中的沉浸感[8]。元宇宙概念大火后,Ready Player Me 便提供了一种便捷的方式,让用户可以快速创建并自定义虚拟角色(数字替身),链接至不同的元宇宙平台。
(3)智能NPC与交互:借助AIGC技术,元宇宙中的非玩家角色(Non⁃player Character, NPC)可以具备更高的智能程度,与用户进行更加自然、真实的交互。这将为用户提供更加丰富的虚拟世界体验,增强元宇宙的吸引力[9]。目前颇受关注的OpenAI的ChatGPT,以及微软New Bing都能用于生成有趣且具有一定深度的NPC对话。
(4)内容生成与推荐:AIGC技术可以实现大量元宇宙内容的自动生成,包括任务、剧情、活动等。同时,AI系统还可以根据用户的兴趣和行为进行个性化推荐,为用户提供更加精准、有趣的内容体验[10]。以AI Dungeon为例,这款游戏利用AI技术生成个性化的冒险故事,根据用户的输入和选择提供不同的剧情走向,为元宇宙中的个性化内容生成提供了一种实践方案。另外,使用推荐系统技术,如协同过滤和深度学习,可以帮助用户在元宇宙中发现感兴趣的活动和体验,从而提高用户粘性和满意度。
(5)虚拟经济与创新商业模式:AIGC技术有助于开发新的虚拟商品和服务,推动元宇宙中的虚拟经济发展。此外,AI技术还可以为元宇宙创新商业模式提供支持,例如通过智能合约实现虚拟资产的交易与管理。比如,Decentraland这一基于区块链技术的虚拟世界平台,用户可以购买、出售和交换虚拟土地、建筑等资产,AIGC技术可以帮助设计独特的虚拟物品,增加其价值。此外,艺术家可以利用AIGC技术创作独特的虚拟艺术品,并通过非同质化代币(Non⁃Fungible Token,NFT)进行交易,为元宇宙中的创作者提供收入来源。
综上,AIGC技术在元宇宙建设中具有广泛的应用前景,有望为元宇宙的发展提供强大的技术支持,推动元宇宙成为一个更加丰富、有趣、智能的虚拟空间。随着AIGC技术的不断进步,我们有理由相信,它将在未来的元宇宙建设中发挥越来越重要的作用,为用户带来更加精彩的虚拟体验。
3AIGC技术面临的挑战
随着AIGC技术的飞速发展,我们必须关注这一领域所面临的各种挑战。从技术进步到伦理问题,再到市场竞争与合作,了解这些挑战有助于我们更好地探讨AIGC技术的发展趋势,以确保未来的技术应用能够更加安全、高效且创新。本节中我们将深入探讨AIGC技术所面临的一系列挑战,以期为读者提供更全面的视角。
(1)技术成熟度问题。虽然AIGC技术在动画制作和元宇宙领域展示出巨大潜力,但目前该技术仍处于发展阶段。实际应用中,AIGC技术可能会遇到一些技术瓶颈和局限,例如生成质量的波动、算法稳定性和实时性等问题[11]。这些问题需要进一步研究和解决,以便在实际应用中取得更好的效果。
(2)数据质量与可用性。AIGC技术的核心是基于大量数据进行训练和生成。因此,数据质量和可用性对于AIGC技术的发展至关重要[12]。然而,高质量数据的采集、整理和标注是一个耗时且昂贵的过程。此外,数据隐私和版权问题也可能对AIGC技术的发展造成一定影响[13]。
(3)人工智能伦理问题。随着AIGC技术的广泛应用,关于人工智能伦理的问题也逐渐浮现。例如,AIGC技术可能导致动画行业的部分人员失业,以及在元宇宙中引发虚拟世界与现实世界的边界模糊等问题[14]。这些伦理问题需要社会各界共同关注和讨论,以确保AIGC技术健康可持续发展。
(4)法律法规与监管。随着AIGC技术在动画行业和元宇宙领域的广泛应用,相关法律法规和监管也成为必然的挑战。各国政府和监管部门需要制定相应的政策和标准,以确保AIGC技术的合规、安全和可控。同时,企业也需要关注法律法规变化,确保其在AIGC技术应用过程中遵守相关规定。
(5)技术竞争与市场竞争。AIGC技术作为一个新兴领域,各大企业纷纷加入竞争,寻求市场份额。在这种背景下,技术竞争和市场竞争将变得愈发激烈。为了在竞争中保持领先地位,企业需要不断投入研发,优化技术,提高服务质量,降低成本,并关注行业动态和市场需求。
AIGC技术虽然具有巨大的潜力,但在实际应用中仍面临诸多挑战。技术成熟度、数据质量与可用性、人工智能伦理问题、法律法规与监管以及技术竞争与市场竞争等方面都需要关注和努力。只有不断克服这些挑战,AIGC技术才能在动画行业及元宇宙领域实现更广泛、更深入的应用,为人类社会带来更多的价值和效能。
4结论
本文通过对AIGC技术在动画行业和元宇宙领域的潜力、应用及挑战进行深入分析,得出了以下结论:AIGC技术具有广泛的应用前景和巨大的发展潜力,可以为创意产业开辟全新的可能性,推动艺术、文化和技术的发展。然而,AIGC技术同时也面临着伦理、技术和市场方面的挑战。为应对这些挑战,我们需要加强伦理监管、促进技术研究与创新以及开发多样化的市场应用。未来,AIGC技术必然在动画制作、元宇宙建设以及其他领域面临更为广泛的应用。随着技术的不断发展,我们有理由相信AIGC将带来更多创新、高效和多样化的解决方案。然而,我们也必须关注AIGC技术带来的社会影响和伦理问题,确保其可持续发展和负责任应用。AIGC技术为我们提供了一个全新的视角,展现了未来创意产业的无限可能。我们期待着这一领域的进一步发展,及其为人类带来的诸多惊喜和挑战。
参考文献
(向下滑动阅读)
[1] 银宇堃,陈洪,赵海英.人工智能在艺术设计中的应用[J].包装工程,2020,41(6): 252⁃261.
[2] 金家琴,夏翠娟.数字人文在视觉化艺术领域的应用前沿——图像艺术分析与计算机生成艺术[J]. 图书馆杂志,2021, 40(6): 101⁃109.
[3] 李成彬.计算机图形图像处理的关键技术[J].电脑编程技巧与维护,2020(9): 141⁃142,149.
[4] Goodfellow I, Bengio Y, Courville A. Deep Learning[M]. The MIT press,2016.
[5] 庄美琪, 谭小慧, 樊亚春, 等.基于卷积神经网络的三维动画表情生成及情感监督方法[J]. 重庆理工大学学报(自然科学),2022,36(1):151⁃158.
[6] 何泽浩,曹良才.面向沉浸式元宇宙的显示,交互和应用[J].科技导报,41(5): 6⁃14.
[7] Brown T B, Mann B, Ryder N, et al. Language models are few⁃shot learners[J]. Advances in Neural Information Processing Systems, 2020, 33: 1877⁃1901.
[8] 喻国明,苏健威.生成式人工智能浪潮下的传播革命与媒介生态——从 ChatGPT 到全面智能化时代的未来[J/OL].新疆师范大学学报(哲学社会科学版). https://doi.org/10.14100/j.cnki.65⁃1039/g4.20230307.001.
[9] 张伟,刘江涛,王云.元宇宙概念、发展现状与技术挑战[J].中国科技论坛,2022,37(1): 31⁃39.
[10] Goodfellow I , Pouget⁃Abadie J, Mirza M, et al. Generative adversarial networks[J]. Communications of the ACM, 2020, 63(11): 139⁃144.
[11] 罗仕鉴,张德寅.设计产业数字化创新模式研究[J].装饰,2022(01): 17⁃21.
[12] Zhu J Y, Park T, Isola P, et al. Unpaired Image⁃to⁃Image Translation using Cycle⁃consistent Adversarial Networks [J]. Proceedings of the IEEE International Conference on Computer Vision, 2017: 2242⁃2251.
[13] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in Neural Information Processing Systems, 2017, 30: 5998⁃6008.
[14] Radford A, Narasimhan K, Salimans T, et al. Improving language understanding by generative pre⁃training[EB/OL]. [2023⁃03⁃15]. Preprint.https://s3⁃us⁃west⁃2.amazonaws.com/openai⁃assets/research⁃covers/language⁃unsupervised/language_understanding_paper.pdf.
主管单位:国家电影局
主办单位:电影技术质量检测所
刊号:CN11-5336/TB
标准国际刊号:ISSN 1673-3215
官方网站:www.crifst.ac.cn
期刊发行:010-63245081
热门跟贴