前言

未来数字人是否能代替真人主播?

薇娅被罚13.41亿元

12月20日,浙江省杭州市税务局稽查局查明,网络主播黄薇(网名:薇娅)在2019年至2020年期间,通过隐匿个人收入、虚构业务转换收入性质虚假申报等方式偷逃税款6.43亿元,其他少缴税款0.6亿元,依法对黄薇作出税务行政处理处罚决定,追缴税款、加收滞纳金并处罚款共计13.41亿元。

消息公布之后,薇娅相关内容迅速登上微博热搜,引起大家公愤,薇娅曾连续两年被誉为网络诚信宣传大使,如今被查出的逃税金额令人咋舌;而在薇娅之前,网络主播的查税问题已经获得高度关注。前不久,杭州市税务局稽查局依法向朱宸慧、林珊珊下达税务行政处理决定书,主播“雪梨”(朱宸慧)、林珊珊两名网络主播涉嫌偷逃税款,被处1倍罚款共计近亿元。

在电商直播平台,薇娅和雪梨是排名前三的两大主播,在行业里属于头部中的顶级。今年双11首场预售直播中,李佳琦销售额达到106.53亿元、薇娅为82.52亿元,第三名雪梨的销售额则为9.3亿元。两大头部主播的查税风波,让风光无限的直播行业“跌落神坛”,背后则是对行业的一次深刻提醒。

数字人能否代替真人主播?

在AI时代,虚拟主播已经开始应用在传媒领域。2018年5月,央视虚拟主持人“康晓辉”亮相屏幕,共同主持《直播长江》安徽篇;2019年央视网络春晚,虚拟主持人“小小撒”“朱小迅”“高小博”“龙小洋”的精彩表现,成为整场晚会中观众讨论的一大热点;2019年5月,人民日报社首款人工智能虚拟主播亮相2019中国国际大数据产业博览会;2020年5月,全球首位3D版AI合成的新闻主播“新小微”进行新闻播报,2021年4月,央视频第一位虚拟主持人——央小天上线,首位虚拟主持人“央小天”后续报道中讲解了“航天员必修课”。2021年9月,在2021世界计算大会上,芒果TV公布了芒果TV首个虚拟主持人“YAOYAO”。

12月16日,新华社AI合成主播首次对话虚拟人,当AI合成主播走到虚拟动漫人中间会擦出怎样的火花?新华社AI合成主播“新小浩”“新小萌”受邀加盟江苏卫视2060,和虚拟动漫人“电视鸡”“无限少女”来了一场史无前例的新闻连线。全球首个AI合成主播面对面采访虚拟动漫人的场景就此诞生。

近几年,AI合成主播不断进军电商、娱乐与新闻等行业,同时技术也越来越成熟。数字化的AI合成主播在外形、声音以及其他功能上与真人的差距越来越小,而且一定程度上承担了真人主播的压力与风险。它们既是智慧媒体融合发展的产物,也推动了智慧媒体的发展。

什么是数字人?

数字人是通过语音合成、唇形合成、表情合成以及深度学习等技术,克隆出具备和真人主播一样播报能力的数字人。通过语音合成技术和视频驱动技术,只需要输入一段文本,它就能在屏幕展现虚拟数字人形象并进行新闻播报,且唇形动作能与播报声音实时同步。虚拟主播形象高度逼真,真实还原牙齿、嘴唇、口红反光等细节,纹理清晰,无动画生硬感。

数字人高逼真的原因

数字主持人”以真人为原型,通过将真人形象数字化扫描技术,建立超写实 3D 数字人建模,多模态识别及生成、实时面部动作生成及驱动、迁移学习等技术「熔炉」,炼就而成。透过 3D AI 合成主播技术实现过程,我们探究数字人为何拥有如此逼真的效果。

1、利用数字化扫描技术还原真人形象

要建立人物模型必须要有大量数据,远传数字化扫描技术通过摄像头对真人原型的身体各个部位进行全方位「打点」扫描,采集每一处细节,并对其多种形态的面部表情动作,嘴部唇动,以及身体的轻微摆动进行细致入微地捕捉记录,还原真人形象。

2、运用深度学习算法生成3D数字人模型

远传算法工程师熟练应用深度学习算法,对算法里的大量参数进行调优,确保生成的3D数字人模型能够精确的还原真人在正常说话时候的唇部动作,脸部表情及微动作,对3D数字人模型进行实时驱动、渲染,使其面部肌肉驱动、表情肢体和语言表达能力达到一个较高的度契合。确保非专业人士无法分辨出是真人拍摄的视频还是通过数字技术合成出来的视频。

AI 驱动、多模态交互

1、AI 驱动的 3D 数字人

“数字主持人”是一种由AI所驱动的虚拟存在,拥有和真人一致的音容、笑貌和言谈举止,拥有表达情感和智慧的能力。具体来说,3D “数字主持人”靠 AI 算法实时驱动,输入一个文本就能输出一个视频,往往生成一个 1 分钟的视频,只需要 1 分钟,就可以看到实时生成。

2、关键技术赋能多模态交互创新

通过深度学习算法、唇动算法、3D建模技术、5G通信等关键技术探索文本、语音和视觉多模态交互创新的无限可能。利用唇动算法分析出数字人应显示的口型标记,突破语言交流过程的表情和唇动的无缝链接;根据给定人物形象要求,建立数字人3D模型,绑定骨骼,创立动作动画和口型动画;基于深度学习算法、肢体捕捉技术,将文本、音频和图片实时生成数字人视频;5G通信技术则让用户跟数字人进行语音视频互动成为可能,麦克风和摄像头捕捉用户的语音和动作,数字人的后端人工智能算法根据场景生成对应的数字人交互动作、表情和语音。

虚拟主播与真实主播相比,虚拟主播具有一天24小时随时待岗、始终保持最佳状态、不会出现播报失误、随时随地响应等优点,数字人服务在主播播报行业凸显优势,成为主播播报行业发展又一新趋势。

那么,随着AI技术的发展和数字人功能的完善,虚拟主播会不会逐渐取代真人主播?从目前虚拟主播的优势和受青睐程度来看,“真人主播+虚拟主播”双主播的场景会更受大家的欢迎。真人主播负责主要新闻内容的播报,虚拟主播负责突发新闻的输出。这种模式,既可以与观众产生情感上的共鸣,也可以充分利用虚拟主播24小时全时段播报的优势,成为真人主播的好帮手。

对此,大家怎么看?欢迎评论区留言

免责声明

文章来源:中国机器人网

凡资讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网赞同其观点,也不代表本网对其真实性负责,转载请联系原出处。您若对该文章内容有任何疑问或质疑,请立即与后台小编联系,平台将迅速给您回应并做处理。注明本公司原创内容,转载请与我们联系哦