本期导读
编者按
当前,媒体融合进程持续深化,视听文化发展格局重构优化,高品质、智能化、沉浸式、多元化、融合化已成为影视技术发展的共性特征。智能经济与智能社会是经济与社会发展演进的基本趋势和必然要求,伴随大语言模型、多模态模型、深度学习、具身智能等现代智能科技的发展演进及广泛应用,人类社会加快步入智能计算时代。适应媒体深度融合趋势和智能计算时代特征,电影产业应积极融合应用新一代信息通信技术、现代智能科技和新兴视听技术,将全产业链信息化云化智能化升级作为战略支撑,创新升级电影摄制手段和播映方式,大力推进电影科技自主创新和自立自强,为观众提供更具高品质、科技感和沉浸感的电影作品和观影体验,努力构建新型视听文化业态和产业发展新赛道,推动电影全产业链全价值链提质优化升级。本期专栏特别刊登《智能计算时代深化电影科技创新和推进电影强国建设的思考与启示》一文,立足进一步全面深化改革、推进中国式现代化国家战略,提出了兼具思想高度、理论深度和创新思维的思考启示与发展建议;同时遴选有意义人类控制与AI影视创作、基于人工智能的音乐生成、数字人技术与大模型的融合创新、基于色彩迁移的数字调色方法、基于AI的影视版权保护等技术论文,从行业技术整体发展升级、音视频智能制作、模型生成和数字调色、安全与版权保护等角度论述了当前人工智能技术在电影行业的深度应用要点;另有缩微胶片技术、电影公益放映内容“中央厨房”等科技论文探讨了传统技术与新兴技术的融合发展,欢迎广大读者予以关注。
——本期责编
专家点评
当前,我们正处于第三次技术革命浪潮中,人工智能应用前景日趋清晰,人工智能应用场景日益广泛。特别是在电影文化领域,生成式人工智能更是具有大规模提高生产效率的潜能。在此背景下,中国电影科学技术研究所(中央宣传部电影技术质量检测所)总工程师刘达率团参加了人工智能领域国际顶级学术会议,并开展了技术调研和考察交流,在此基础上撰写完成《智能计算时代深化电影科技创新和推进电影强国建设的思考与启示》一文。文章在简明扼要介绍欧洲高新技术格式电影制作播映发展与应用最新成果的基础上,针对电影产业、现代影院和沉浸式视听技术的发展与应用,提出把电影级主动发光显示技术和沉浸式视听技术作为重要抓手,以有效提升影院视听品质和观影体验。此外,适应智能计算时代发展特征和生成式人工智能演进趋势,提出了电影行业要统筹推进模型自主研发与行业定制改造的技术思路,同时探讨了电影行业在积极探索人工智能应用中强化人工智能安全治理和版权保护的方式。文中提出我国要加快构建完善以“文生电影”为核心的电影智能化创作生产技术体系,发展完善以现代智能科技为核心支撑的电影新质生产力,推进电影摄制播映向高品质沉浸式多元化升级,构建发展新型视听文化业态,优化升级视听文化服务,为新时代新征程推进我国电影科技创新升级和高水平自立自强提供了富有前瞻性、建设性和可实施性的思考启示与发展建议。
——徐进
中央广播电视总台技术局局长
中国电影电视技术学会理事长
过去一年,生成式人工智能(Generative AI, GenAI)在音视频领域的应用呈现井喷发展态势,特别是今年2月Sora的发布,让人们对GenAI的表现有了极大的信心。当影视人致力于将这一技术应用于专业制作领域时,却发现还存在诸多问题,除了画面细节少、连续性差、角色动作受限等,最大的问题是生成的内容可控性差。如何让GenAI生成的结果能够为创作者所控制,能够听从人的指挥,是GenAI技术必须要解决的问题。《有意义人类控制(MHC)在AI 影视创作中的探索与应用》通过总结团队AI视频生成的经验,结合有意义人类控制(Meaningful Human Control, MHC)概念,对比了三种不同的自动化工具设计思路,选择了人在回路中(Human⁃in⁃the⁃Loop, HITL)的设计模式来解决可控性问题,总结了目前AI影视创作中模型微调、提示词生成、生成要素控制等几种控制方法,并预期未来会采取多模态控制技术对模型进行精细控制。本文对当前热点的GenAI可控性问题进行了理论分析,并在实践基础上提出了切实可行的解决方案,对于推动AI技术在影视行业进一步落地应用具有很高的参考价值。
——陈军
研究员
北京电影学院影视技术系主任
近年来,人工智能生成内容(AIGC)技术迅猛发展,其主流模型框架以深度神经网络为基础,由早期的GAN、VAE向Transformer、Diffusion与DiT(Diffusion Transformer)发展演进。其中,大语言模型(LLM)文本生成技术日渐成熟,引领推动图像与声音生成技术的发展,并通过不断增强可控性以满足日益增长的个性化创作需求。音乐作为电影不可或缺的表达元素,顺应AIGC技术的发展与应用,AI音乐生成正逐步成为电影配乐创作的革新力量,迄今已分化出符号生成与音频生成两种技术路线,但现有方法对音乐流派等控制条件关注不足,一定程度上影响了音乐生成质量和多样性的提升。《基于多粒度注意力Transformer的电影音乐生成研究》一文以编码后的流派信息作为条件输入从零生成符号音乐,结合音乐重复周期的结构特点,采用多粒度注意力机制Transformer架构捕获音乐结构和上下文信息,并引入流派分类判别器,输出流派分类概率用于识别判断,为音乐生成提供风格控制。本方法在流派控制效果、音乐质量结构等方面较同类方法有较大提升,但在实用性上仍有改进空间,有待进一步研究探索。
——王萃
正高级工程师
中国电影科学技术研究所(中央宣传部电影技术质量检测所)高新技术研究处副处长
本期目录
专栏:全面深化电影科技自主创新
积极推进高水平科技自立自强
◎ 智能计算时代深化电影科技创新和推进电影强国建设的思考与启示
—— 刘 达 王 萃 高 峰
马鸿悦 张海悦 王 健
前沿技术
◎ 有意义人类控制(MHC)在AI影视创作中的探索与应用
——王 雷
研究与开发
◎ 基于多粒度注意力Transformer的电影音乐生成研究
——熊晓钰 谢志峰 黄登云 朱永华
◎ 基于K近邻色彩迁移算法的数字调色方法研究
—— 杨岚彬 姚正安
视听科技教研
◎ 数字人技术在电影与数字内容领域的创新应用
——刘笑微 肖婧澜 宋 震
◎ 全球化视域下数字媒体技术赋能中国神话IP电影创作
—— 国天依 孙立军
版权保护
◎ 基于AI的影视版权保护技术研究
——庞胜楠 李建亮 马国栋
技术应用
◎ 电影公益放映内容“中央厨房”设计与实现
——李聿为
◎ 缩微胶片技术在电影文图档案保存中的应用综述
——李 英 王 瑶
文章概要
智能计算时代深化电影科技创新和推进电影强国建设的思考与启示
【摘要】 人类社会正加快步入智能计算时代,现代智能科技对电影产业的影响持续深化和不断泛化,机器学习、深度学习、人工智能生成内容(AIGC)、大语言模型(LLM)、多模态模型等技术正在深刻影响和重构优化电影全产业链全价值链。伴随电影科技创新进入攻坚期和深水区,电影产业发展面临新形势新要求,我们要深化电影科技自主创新,积极推进电影行业的智能化升级,推进生成式人工智能、人工智能大模型、沉浸式视听等技术在我国电影行业的定制设计、自主研制与科学应用,有力支撑和服务社会主义电影强国建设。
有意义人类控制(MHC)在AI影视创作中的探索与应用
【摘要】 当前AI工具存在自动化程度过高、人类控制不足造成生成结果可控性差的问题,成为其应用于专业影视创作的主要壁垒。本文通过总结自主视频生成流程“墨池”(Inkstone)设计与应用中的经验,结合人工智能(AI)与自动化领域的有意义人类控制(Meaningful Human Control, MHC)概念,对比了三种不同的自动化工具设计思路,分析了基于MHC的AI影视创作流程和工具开发具体方式,以及目前加强人类控制的若干可行技术路径。研究表明,加强AI训练和生成过程中的MHC,有望在发挥AI工具优势的前提下,对生成内容进行准确控制,从而使创作能够体现艺术家意图,适应专业影视创作需求。
基于多粒度注意力Transformer的电影音乐生成研究
【摘要】 电影音乐自动生成是当前人工智能领域的研究热点之一,不少深度学习音乐生成算法可实现动听的电影配乐生成,但这些算法在生成过程中往往忽略了流派等风格控制。针对这一情况,本文提出了一种基于多粒度注意力Transformer的电影音乐生成方法,可根据目标流派从零生成音乐。本方法在引入多粒度注意力Transformer建模音乐结构的基础上,引入了对抗学习机制,通过具有流派分类损失和生成对抗损失的流派辅助分类判别器,加强模型对流派信息的控制。在所构建的包含流派信息的符号音乐数据集上进行的主客观实验表明,本文方法在生成音乐质量和流派控制方面均优于以往方法,有助于基于目标流派自动生成电影配乐。
基于K近邻色彩迁移算法的数字调色方法研究
【摘要】 色彩是电影中必不可少的元素,其能给予观众视觉冲击力,是凸显人物性格特征、表达电影主题、营造电影氛围、增强电影故事感的重要手段。在数字电影时代,图像色彩迁移技术为数字电影调色提供了更为便捷的方法。本文提出一种基于 K 近邻(K⁃Nearest Neighbor, KNN)回归模型的图像色彩迁移算法KNN⁃1,同时基于目标图像的全局统计量特征与局部像素特征,提出了先采用该算法后采用经典Reinhard色彩迁移算法的KNN⁃2算法与先采用Reinhard算法再采用该算法的KNN⁃3算法。结果表明,基于K近邻回归模型的色彩迁移算法所得到结果图颜色与目标图像相似,但是整体颜色偏浅,亮度较亮。KNN⁃2、KNN⁃3算法得到的迁移结果图的效果都较K 近邻、Reinhard两种算法单独使用有明显提升,迁移结果图整体色彩基调与目标图像更为相似。
数字人技术在电影与数字内容领域的创新应用
【摘要】 为探讨数字人技术在电影、数字内容领域的创新应用,本文通过对数字人技术的发展及应用,利用涵盖多学科领域技术的数字人技术以及人工智能(AI)为数字人创作提供的解决方案,提出未来数字人技术在电影产业及数字内容领域的发展方向。数字人技术将基于原有技术底座,逐步接轨人工智能赋能各细分技术领域,通过大量混合路径尝试和多方位技术实践完成“数字”到“数智”的创新之旅。本文还对数字人与大模型的关系进行了深入研究,认为数字人的独特性对大模型提出了创新性需求,未来数字人技术与大模型能力高度融合,将真正完成在虚拟世界实现复刻的终极目标。
全球化视域下数字媒体技术赋能中国神话IP电影创作
【摘要】 传统文化IP创作是娱乐行业中的富矿与必争之地。中国拥有悠久而深厚的灿烂文明,积累的数千年奇幻神话构成了我国特有的东方浪漫。运用数字媒体技术与设计思维结合中国优秀传统文化进行创造性转化,不仅对于树立文化自信、提升中国文化软实力意义重大,而且对于提升中国传统文化和文化软实力的认同度也将起到不可忽视的作用。本文将以中国神话IP作为切入点,重点阐述数字媒体及其相关衍生技术在助力中国神话IP视觉表现,论述中国传统文化“活化”过程中技术赋能的主要特征及具体实施路径,提出“道”“术”兼修,利用技术手段表达想象力和创造力,书写具有东方魅力的“中国故事”。
基于AI的影视版权保护技术研究
【摘要】 随着技术革新,影视版权保护正面临前所未有的挑战。盗版泛滥严重冲击影视产业,影视侵权行为呈现多样性、隐蔽性、跨境性等特征。本文基于对影视版权保护现状的深入分析,探讨AI技术在解决这些问题中的潜力和挑战。通过引入AI技术,期望降低版权保护成本、提高版权交易透明度、加强版权保护效率和准确性。然而,AI技术的应用也面临数据隐私保护、技术更新等挑战。本文旨在为影视版权保护提供新的思路和方法,推动影视行业健康有序发展。
电影公益放映内容“中央厨房”设计与实现
【摘要】 随着电影公益放映观影人群对于电影内容需求的不断增长,原有“库房式”内容供给模式已不能满足发展需要,亟待转型升级为以“一次采集、多种应用”为核心技术特征的电影公益放映内容“中央厨房”式供给模式。本文从电影公益放映内容供给需求分析入手,详细阐释电影公益放映内容“中央厨房”的总体设计技术架构及其细分技术构成要素,着重分析了电影公益放映内容“中央厨房”构建过程中的能力集群架构设计、关键技术难点突破等核心要点环节,提出一套模组模块化能力集群架构设计解决方案,经初步试用,该方案已可实现为观影群众提供智能匹配、快速制作、精准推送等定制化、厨房式的内容供给服务,充分发挥内容库核心价值,为行业内相关单位媒体资源库转型升级提供参考与借鉴。
缩微胶片技术在电影文图档案保存中的应用综述
【摘要】 本文旨在研究缩微胶片技术在电影文图档案保存中的应用现状及面临的挑战,尤其关注人工智能在缩微技术中的应用方法。通过对缩微胶片技术的发展历程、电影文图档案的保存需求以及缩微胶片三级保护体系实践的梳理,对技术挑战、管理和操作问题、政策和标准及未来发展等关键问题进行探讨,提供面向未来的档案保存策略和理念建议,以促进电影档案保存的长期稳定性和安全性,为保护和传承电影文化遗产提供科学和系统的支持,特别是利用AI优化缩微技术的应用,增强档案智能检索和分析能力。
文章全文详见《现代电影技术》期刊
2024年第9期
主管单位:国家电影局
主办单位:电影技术质量检测所
标准国际刊号:ISSN 1673-3215
国内统一刊号:CN 11-5336/TB
投稿系统:ampt.crifst.ac.cn
官方网站:www.crifst.ac.cn
期刊发行:010-63245081
热门跟贴