期刊导读 |《现代电影技术》2024年第12期|图像处理|现代电影技术

本期导读

编者按

人工智能（AI）是新一轮技术革命的核心关键技术，为电影行业发展新质生产力提供了重要支撑，并将引发未来影像技术升级和观影变革。自OpenAI Sora引发行业对AIGC文生视频技术关注以来，Runway、Pika、谷歌Veo、可灵AI、海螺AI等相关工具百花齐放，呈现出强大的现实仿真能力。当前AIGC工具在物理规律理解等方面尚存缺陷，暂时无法直接用于电影内容生成，但AI已显现出辅助影像与声音内容制作和处理的强大能力，已初步实现人机协作和人机融合，并加快进入深度应用的智能体批量涌现阶段。作为未来人工智能发展应用的主要方向，AI智能体有望呈现出类似人类智能的知识推理和决策能力，可破解通用大模型在电影行业应用的关键难题，实现更加高效、优质、可控的人机协作。本期遴选基于人工智能技术的未来影像研究与思考、AI 音频技术在电影对白和音效制作中的应用探究、图片AI短片创制实践、AI动作捕捉在虚拟预演中的应用研究等研究文章，从影像和声音制作、虚拟制作、图像处理等角度出发，分享和探讨电影行业AI智能体的发展升级和应用实践；同时遴选基于渲染引擎的VR眼动跟踪数据可视化研究、数字影厅B环电声响应技术标准解析和调试方法等技术论文，探讨沉浸式视听技术研究和实践，欢迎广大读者关注。

——本期责编

专家点评

当前，全球电影行业已进入大科学、大视听、大融合时代，多学科多业务交叉渗透明显，生产流程持续优化升级，数字技术与实体经济、网络空间与现实社会融合发展趋势日益明显，进程不断深化。以人工智能（AI）、大数据、云计算等新一代信息技术为核心的技术创新进入前所未有的密集活跃期，工程科技成为推动电影科技进步和产业升级的重要引擎。面向2035年电影强国建设目标，电影行业需聚焦AI技术自主研发与大模型行业定制、新型放映模式拓展、影院多业务融合等新领域新赛道，加快推动电影创新技术研发落地，统筹推进“十五五”电影科技发展预测分析、电影国际标准突破跃升、放映装备国产化、电影重点实验室创建等重点科技工作。随着人工智能技术的持续演进，影像技术品质、视觉体验、场景设计质量、制作效能持续提升，同时也给影像创作生产、传输分发、解码播映等产业节点带来风险和挑战。构建既促进技术创新和产业升级，又确保安全可控并符合技术伦理的AI发展环境，是当前行业关注热点和难点。《基于人工智能技术的未来影像研究与思考》一文，从电影创制、计算机图形学、三维视觉等多维度出发，分析探讨了AI在计算机模拟、虚拟摄制、模型驱动、影像呈现、电影内容创制等领域的应用实践，提出了AI创制内容的审美策略和多样化技术落地思考，为构建我国新一代影像创制解决方案提供了技术思路。本文观点准确、内容详实，将带给从业者和读者深层次的思考启示，具有很好的行业指导意义和借鉴参考价值。

——龚波

正高级工程师

中国电影科学技术研究所（中央宣传部电影技术质量检测所）党委书记、所长

在国家推动文化产业高质量发展的背景下，以AI大模型为代表的通用人工智能技术的发展与应用，将为电影产业带来前所未有的变革。AI音频技术通过精准模拟人声和环境音效，不仅大幅提升了对白与音效的制作效率和质量，还显著增强了影视作品的沉浸感与艺术表现力，为国产电影走向世界舞台提供了强有力的技术支撑，助力中国故事以更加生动鲜活的方式呈现于全球观众面前，是实现中华文化自信自强的重要途径之一。论文《AI音频技术在电影对白和音效制作中的应用探究》梳理和回顾了AI音频技术从20世纪50年代至今的发展历程，有助于理解当前技术的演进过程和关键节点；对AI音频制作工具进行了分类梳理，并从主要功能、代表性工具、特性及精度等维度进行了性能对比，有助于理清AI音频工具的最佳应用场景；深入分析了相关技术在语音生成、动效生成、音响效果生成等电影对白生成和音效制作中的具体应用，展示了AI音频技术在实际影视制作中的应用潜力。论文从应用角度指出了当前AI音频技术在复杂情感表达、语种覆盖范围等方面的局限性并提出未来展望，为后续研究和发展应用指明了方向。

——王士进

正高级工程师

科大讯飞副总裁、讯飞研究院执行院长

认知智能全国重点实验室副主任

智能科技已逐步应用于电影摄制过程中，极大地提高了内容生产效率，辅助创作者突破了例如换脸、减龄、场景修复还原等摄制难点。图片AI短片制作或曰“AI动图”技术，利用机器学习模型分析图片内容，并基于原图自动生成具有动态效果的图像序列，最终合成高质量、流畅自然的动态视频。该技术不仅提高了图像处理的效率和质量，也为创意表达提供了更多可能，为用户带来更加丰富和动态的视觉体验，并持续推动媒体展示和内容创制的边界。鉴于影院大银幕放映存在分辨率高、画面大等特点，该技术推广到大银幕放映尚存在技术难点。《融合智能科技的影像艺术表现力多元化发展研究——以图片AI短片〈故乡〉创制实例为例》一文深度分析了图片AI短片《故乡》创作的理论基础与技术实践，从分层切割、算法提取、背景填充等方面阐释了AI技术如何使图片素材向动态转化的技术性操作，同时AI技术也为短片解说、配乐等环节提供了与画面艺术高度契合且更具个性化与多元化的创作方案。短片《故乡》的创作过程是依托智能科技实现图像与视频两种不同艺术载体相互融合与转化的一次创新性探索与实践。可以预见，未来在智能科技的加持下，电影艺术在内容表达、创作生产、表现形式、传播渠道、观影体验等方面将会有更为生动且创新的突破。

——邢占宇

华夏电影发行有限责任公司副总经理

本期目录

论坛实录

◎ 基于人工智能技术的未来影像研究与思考

—— 陈宝权　李道新　孙立军　夏　鹏

视听科技教研

◎ AI音频技术在电影对白和音效制作中的应用探究

—— 王　珏　李洽楠

◎ AI动作捕捉在影视虚拟预演中的应用研究

—— 董俊希　赵建军　鲁梦河

技术应用

◎ 融合智能科技的影像艺术表现力多元化发展研究——以图片AI短片《故乡》创制实践为例

—— 李立新　周令非　段　毅

◎ 基于渲染引擎的VR眼动追踪数据可视化研究

—— 焦垚楠

◎ 非渲染技术语境下沉浸式音频空间构建方案的探索与思考

—— 林义超　张　泽

标准研究

◎ 数字影厅B环电声响应技术标准解析和调试方法探讨

—— 张　辉

研究与开发

◎ 深度反卷积神经网络优化下的低质图像去模糊数学模型

—— 亓金锋

2024年总目录

◎ 《现代电影技术》2024年总目录

文章概要

基于人工智能技术的未来影像研究与思考

【摘要】作为一种现代表达媒介和艺术形式，电影将视觉、听觉等多种感官与记录、叙事、抒情等元素融为一体，创造出令人难以忘怀的体验。电影与计算机技术的紧密联系，使其在过去几十年中不断进化，产生了如数字视效（VFX）、虚拟现实（VR）等诸多革新。近年来，随着人工智能（AI）技术的快速发展，特别是OpenAI Sora等文生视频工具的出现，使其在电影制作中的潜力备受瞩目，并被认为可能颠覆电影创制全过程。本文基于2024中国计算机大会（CNCC2024）“AI与未来影像”论坛，回顾了计算机图形图像技术在数字影像发展过程中的重要支撑作用，探讨了AI时代电影工业所面临的机遇与挑战，展望了AI技术在电影行业乃至未来影像领域的发展趋势，对进一步推动电影与AI技术的深度融合进行了探索。

AI音频技术在电影对白和音效制作中的应用探究

【摘要】 AI音频技术在当前电影对白和音效制作领域备受关注且已逐步应用到实际制作中。本文介绍了AI音频技术的主要概念及发展概况，对现阶段AI音频制作工具进行了分类整理，并按照电影对白和音效制作中声音生成与声音处理两大应用场景，探讨AI音频技术在电影对白和音效制作中的应用进展与未来前景。研究表明，目前AI音频技术可用于部分场景和部分类别的对白生成，但缺乏复杂情感表达能力；在动效和音响效果生成中可完成一定的素材准备，但精确度和丰富度有待提高。在声音处理方面，AI音频技术具备较强的音频降噪及增强、对白音色替换、动态及响度控制、音色及空间处理能力，在声音编辑和预混中已得到实际应用，但尚无法胜任声音设计、混录等需要高度依赖艺术创造力的环节，暂不具备独立完成整部电影声音制作的能力。

AI动作捕捉在影视虚拟预演中的应用研究

【摘要】中小成本影视剧组的虚拟预演环节，通常采用预演软件、关键帧动画、传统动作捕捉以及物理模拟等方法控制虚拟角色运动。然而，这些方法分别存在预演精度不足、耗时耗力、需配备专业设备及制作流程复杂等缺陷。针对上述问题，本文提出一种新的虚拟角色控制方法，利用AI动作捕捉技术实现了虚拟角色的运动控制，并进行了虚拟预演短片制作。通过简化流程，实现了虚拟角色的动作捕捉，从而扩展了虚拟预演的应用范围。实验对比表明，该方法所呈现的数据精度能够满足虚拟预演需求，无需佩戴专业设备即可实现近似实时的效果，同时该方法性价比较高，且场地限制较小。

融合智能科技的影像艺术表现力多元化发展研究——以图片AI短片《故乡》创制实践为例

【摘要】在媒体融合和全媒体传播的大环境下，新兴技术加速转化为新质生产力，如何利用技术实现文化表达、拓宽影视作品的创作思路，是当前电影技术应用领域的关注热点之一。智能科技与艺术相融合对影像艺术表现力的影响，是电影学术研究和电影产业发展共同探索的方向之一。本文结合国内首部基于图片的AI院线映前短片的创制实践及相关理论研究，提出了智能科技与电影艺术相融合的规律性方法，并以实际案例进行验证。研究结果表明，本文提出的基于图片的AI短片制作方法具备艺术性、创新性和实用性，影院银幕提升了相关内容的全媒体传播效能，有助于实现影视作品类型的多样化。

基于渲染引擎的VR眼动追踪数据可视化研究

【摘要】传统眼动追踪技术主要用于平面影像的认知研究。电影媒介在数字时代逐步从银幕扩展至更多元的空间，虚拟现实（VR）眼动追踪技术为电影研究提供了新的研究路径。与此同时，借助实时渲染引擎对VR眼动追踪数据进行可视化分析变得极为必要。本文介绍了眼动追踪技术在电影研究中的应用及VR眼动追踪技术可视化的研究现状，提出了一种基于虚幻引擎的VR眼动追踪数据三维可视化方案，并以多银幕影院场景为例，详细介绍了其实现方法和效果，以期为电影研究和未来影像创作提供新的视角和工具。

非渲染技术语境下沉浸式音频空间构建方案的探索与思考

【摘要】本文以沉浸式音频技术为研究对象，系统探讨了非渲染模式沉浸式音频技术的理论基础与实践应用。文章首先对当前以渲染模式为主导的沉浸式音频技术进行了深入分析，阐释了其核心原理及其在音频制作领域的广泛应用，继而着重论述了非渲染模式沉浸式音频技术的理论支撑，详细解析了该技术在声道布局和声像处理领域的创新方法，并结合新华社“全六觉”实验室空间搭建和设备布局的具体案例，展示了其构建沉浸式音频空间的有效性。最后，文章进一步探讨了非渲染模式沉浸式音频技术对音频制作领域的深远影响，包括其在技术创新、成本控制方面的优势以及对音频工作者思维模式的促进作用。通过对渲染与非渲染模式的比较分析，揭示了沉浸式音频技术发展的多元趋势和未来潜力。

数字影厅B环电声响应技术标准解析和调试方法探讨

【摘要】数字影厅B环电声响应特性是指数字影院音响系统对电信号的响应情况。本文首先概述数字影厅B环电声响应特性相关技术标准，对GY/T 312—2017《电影录音控制室、室内影厅B环电声响应规范和测量》中涉及的核心技术条款进行解读，总结调试和测量过程中遇到的问题，最后提出一种合理的B环电声响应调试方法，以期为数字影厅相关调试提供技术保障，推动国内数字影厅整体还音技术良性健康有序发展。

深度反卷积神经网络优化下的低质图像去模糊数学模型

【摘要】随着时间的推移，电影胶片由于存放时间长、存储物理环境不一等原因会出现老化、褪色、划痕和模糊等问题，而现存经典资料影片胶片在转换为数字格式进行存储后，大多仍存在随机噪声多、图像质量不高等问题。为缓解上述问题，本文设计了基于深度反卷积神经网络优化下的低质图像去模糊数学模型，首先采用泊松分布法建立低质图像退化方程，分析低质图像的随机噪声；随后构建低质图像去模糊数学模型的初始框架，并利用深度反卷积神经网络对其进行优化，确定损失函数，完成低质图像去模糊数学模型的构建。实验结果显示，本文所提数学模型在实践应用中表现出良好的低质图像去模糊处理结果，峰值信噪比较高，可用于经典资料影片图像画面的修复，在低质图像去模糊领域具备良好的应用前景。

文章全文详见《现代电影技术》期刊

2024年第12期

期刊导读 |《现代电影技术》2024年第12期

热搜

热门跟贴