“大家好,好久不见,我是你们的老朋友东哥……”

4月16日下午6点18分,国人熟知的京东集团创始人、董事会主席刘强东以AI数字人“采销东哥”的形式空降京东超市、京东家电家居采销直播间,开启了他的直播首秀,成功引来众多网友围观。

直播间,“采销东哥”从容自若,大谈自己在运动、烹饪方面的心得,对带货物品的讲解,既专业又热情。独特的宿迁口音,不时搓手指的小动作,还有看手机回复的表情、动作,甚至还会提醒工作人员上链接,让很多观众非常怀疑在看的主播到底是真人还是数字人

这是一场相当成功的直播。据京东超市数据,“采销东哥”上播30分钟,直播间观看人数破千万;直播时段用户平均停留时长达到日常均值的5.6倍;直播期间讲解的13款商品,整体订单量环比上周日均增长7.6倍;京东超市“百亿农补”货品,开播半小时成交额环比上周日均增长5.7倍。更重要的是,刘强东这次AI数字人直播,让外界对这个去年一度火爆却又很快沉静下去的行业,有了一次非常重要的重新认识和认可。

产业崛起

最快三天可诞生一个数字人主播

所谓数字人,简单来说就是运用数字技术创造出来的,与人类形象接近的数字化人物形象。数字人的创建是一项极为复杂的工作,需要经过建模、动画制作、渲染……通过高级计算机程序实现。最终,数字人能还原真人80%以上的外貌,在外观、动作以及声音方面,能做到像现实世界里一样自然。

打开网易新闻 查看精彩图片

■廖木兴/图

直播电商头部机构谦寻控股技术人员去年曾说,在现今的数字技术帮助下,通过采集真人形象及语言、肢体数据,再对采集的数据进行训练开启直播,一个真人形象的AI数字人主播的诞生,最快只需三天。

如果是非真人定制数字人主播,不仅制作成本低,制作效率还能进一步提升。数字人制作头部企业硅基智能近日表示,在硅基智能一开始做数字人时,行业成本还是几万元甚至数十万元一个,但现在已经下降至几百甚至几十元一个。而且,数字人在执行各种选择器、任务器和反馈器任务时,如在直播间人数变少时生成降价促销的直播话术等,具有一定的优势。

随着数字人成本平民化,不少企业都愿意抱着试一试的心态来定制一个数字人。2023年,中国AI数字人行业产品需求量TOP5的行业分别是电子商务及卫生、社会保障和社会福利业、教育、金融和交通运输业。

针对电商行业,艾媒咨询CEO兼首席分析师张毅表示,“目前,AI数字人在电商前端扮演主播的角色,与真人主播形成互补,拉长直播时长,从而提供更大的流量;在后端,AI数字人可以提高系统办公的效率,例如快速上架商品,智能数据统计等。”

近两年,数字人产业得到了迅速发展。艾媒咨询数据显示,2022年中国虚拟人核心市场规模为120.8亿元,同比增长94.2%,预计2025年将达480.6亿元。

后台揭秘

“采销东哥”是如何炼成的?

直播已成为电商平台增收日益重要手段,抖音有董宇辉们、淘宝有李佳琦们,京东为何要推一个AI数字人“采销东哥”来打擂台?

据不完全统计,包括罗永浩、金星、黄圣依夫妇等自带流量的明星,都曾在京东平台开播,但未能“出圈”。在孵化原生主播方面,京东也曾花费大力气,也未有太大成效。今年4月10日,京东对外宣布将投入10亿元现金和流量作为激励,吸引更多原创作者和优质内容机构入驻打造更强内容生态。当时即有一些网友在社交网络上喊话“让刘强东亲自下场做直播”。可能正是这次事件激发了京东内部的想象力,思考用何种方式让具有“名人效应”的老板不太劳累地亲自下场带货。

数字人作为人类形象的模仿和延伸,不仅要“形似”,更要“神似”。在“采销东哥”的首秀中,网友们惊讶地看到,“采销东哥”AI数字人近乎百分百还原了刘强东本人的表情、姿态、手势和音色,让“数字分身”也有了鲜活的生命力。

打开网易新闻 查看精彩图片

记者从京东了解到,“采销东哥”背后依托的,是京东言犀大模型对形象与声音的不断学习与训练优化。

京东云言犀团队原本打算使用一段演讲音频作学习素材,但经过测试发现,当时演讲的语气用于直播带货过于正式。因此,京东云言犀团队又录制了一段20分钟闲谈,让东哥畅聊自己的旅行经历,提取出声学特征后,通过言犀语音大模型合成出人工语音。目前,言犀团队已经可以做到最短使用6秒素材,就能复现一个真人的声音。

说好普通话并不难,但要让“采销东哥”AI数字人学习本人的发音习惯,比如要不要加鼻音,哪里要连读,就需要大模型给出判断。言犀语音大模型在训练时,被“喂”入5万小时鲜活的语音数据,这让言犀数字人可以智能匹配不同直播风格,比如用沉稳的音色营造专业的氛围,又或者用极具感染力的声音吸引用户下单,还赋予言大姿态肢体表现。

言犀也对语音风格进行了精细控制,捕捉并复制了说话时的情感,使得合成的语音不仅在音色上与真人相似,而且在情感表达上也保持一致,包括口音和节奏的细微差别、语速的快慢和语调的抑扬顿挫。结合语义理解,系统进行口唇、肢体驱动,让数字人说话时的动作与语义匹配,更加自然,比如在讲话时他偶尔会搓动手指,强调某件事时会配合更大幅度的手部动作,还有时不时的点头等。

实验表明,绝大部分用户在120秒内难以察觉这是数字人,怀疑是真人录制或者AI换脸。

在回应部分网友认为“采销东哥”当晚表情过于严肃时,言犀团队表示,为使数字人从形象到声音,更贴合真实直播场景,团队打造“声音供应链”,基于多颗粒度韵律的增强语音合成技术,准确把握用户情绪,提高合成语音的韵律丰富度和可控性,并将根据反馈持续迭代。

“花瓶”困境

数字人不应是企业吉祥物升级版

仅仅在技术上做到数字人形似、神似真人,对数字人技术的商业应用来说肯定还不够,尤其是在可能“每秒几十万(元)上下”的电商行业,关键要在提高收入、降本增效上更胜真人。

实际上,2023年上半年,直播行业里数字人主播一度极速火爆,最疯狂时抖音平台上据说平均每3个直播间就有1个数字人直播间,一度还有企业喊出了“数字人让传统主播失业”的口号。

有意让数字人带货的电商商家算盘打得很“精”,声称“与真人主播相比,数字人直播间的成本仅为前者的1/25,因此本质上来讲,只要数字人直播间的效果能够达到真人主播的1/25,就不算差了”。

然而仅仅过了半年,这股热乎劲就慢慢退却了。很多直播运营吐槽,“没啥用,一看就是假人,开播后直播间根本没流量”“数字人主播讲解7*24小时一刻不停,停留在直播间的粉丝却只有个位数”。

有谦寻内部人士日前向记者透露,目前的现实是,在数据层面,数字人直播看不出来降本增效,部分品牌也不太愿意让人知道自己是数字人直播间。“整体上,大家对数字人的观感会觉得不如真人直播间,很多品牌在传播上都会有一些顾虑,也会担心有竞争对手向平台举报导致封号。”

有业内人士表示,数字人的规模化落地依然面临着场景、内容和交互、成本等层层困难。其中,最关键的是场景,如何让数字人摆脱“迎宾花瓶”人设去干活,是一道门槛。其次是内容和交互,如果不能为用户提供正确、有用的内容信息,以及自然、有趣的交互体验,用户很快就会失去兴趣。

对企业商家来说,在内容准确性、互动性方面要求更高,尤其是电商、金融等复杂商用场景中,要提升更难。比如,对于客服场景中最普遍的产品对比,很多数字人因为缺少“知识储备”,不能给出有价值的参考信息。没有专业性,交互有限,导致落地转化难,使得大多数字人只能作为吉祥物的升级版出现。

反观刘强东的AI数字人,记者在直播中发现,“采销东哥”并不是一味地介绍产品,他也讲述了很多个人经历。据言犀算法工程师透露,“这是因为训练时,导入了东哥此前的个人著述、演讲、新闻报道等丰富素材”。

“采销东哥”带货时的脚本,则是AI学习丰富的商品等信息后一键生成。言犀数字人直播中控台如同数字人的“大脑”,能实时监测和调整直播间商品库存变化,调整直播话术,比如跳过缺货的商品,或为爆品增加讲解频率;还能监测直播间交互是否过于频繁,并调整交互频次和机制,确保讲品顺利。

电商运营专家龚文祥表示,现在的AI数字人,跟观众在情感上的互动,还是有一定距离,不能像真人那样做到自然直接灵活的、有情感的互动。缺乏情绪价值,是AI数字人的局限。所以,他建议真人和数字人结合,比如像在晚上流量好的黄金时间段,就真人上,其他垃圾时间,就可以让数字人代替。

发展

数字人在跨境电商直播中发光发热

AI先导企业百度向记者透露,百度优选的内衣商家林小姐,在其他平台真人直播,在百度使用了数字人直播,该直播间的带货效率(CVR)为5.06%,远高于真人的1.77%。点击转化率提升了285%,相较于真人直播间,数字人直播成本降低300%,CVR提升285%。目前林小姐的数字人直播间,日均GMV增长了2.6倍以上。

而阿里国际早在上个月的一场跨境电商峰会上就对记者表示,包括AI数字人直播等大模型赋能之技术及服务,早已悄然在外贸领域发挥着巨大作用。

据阿里国际介绍,AI数字人直播在B2B电商场景中有着天然的优势。B2B的跨境企业采购不同于C端的娱乐个性化直播,这种外贸直播场景没有类似“oh my god 买它”的营销话术,而是强调对产品本身、对工厂的生产制造能力的介绍,更侧重有关公司实力、工厂生产能力、产品定制、运输费用等方面的回答和接待。

正因此,商家可以清楚地知道卖家关注的重点,从而有针对性地设置好固定的回答,有卖家咨询时,数字人就可以自动打招呼、发名片、发产品目录和回答问题,这也给了AI数字人直播充分发挥实力的场景。

此外,随着国内跨境直播电商业务不断增长,越来越多中小企业进入其中,而语言往往成为最大“绊脚石”,而AI数字人的出现,恰好为众多因直播犯难的商家提供了解决之道。

万兴科技推出的万兴播爆支持数字人直播、直播推流、实时互动、AI智能脚本、AI翻译等功能,帮助了不少中小卖家快速开启直播带货。有阿里国际站卖家使用万兴播爆进行了两个月的数字人直播后,其直播间平台热度一度位居榜一,在线人数稳定保持在和真人相差无几的水平,停留、场观等数据更是创历史新高。

据悉,目前一些专门针对跨境电商业务的数字人主播已经能通晓400多种语言。而且,大多数数字人支持定制化形象,能满足欧美、中东和东南亚等不同国家和地区的审美文化需求。

观点

AI要成为能创造利润、优化成本的数字员工

作为企业创始人,刘强东的AI数字人带货直播首秀算是胜利结束了,但留给行业的冲击余波仍在震荡。“采销东哥”的带货释放了什么信号?

在数字人产业的业内人士看来,2023年大模型及AIGC(人工智能生成内容)的火热,催熟了原本只是“金玉其外”的数字人产品。从虚拟偶像到智能客服、虚拟主播,业界对数字人的产业价值迅速达成共识,不再是仅供娱乐的吉祥物,而是能创造利润、优化成本的数字员工。

硅基智能是行业龙头,也是最早将数字人技术落地直播间的公司之一。公司创始人司马华鹏近日对媒体表示,刘强东这次数字人直播,对行业是非常大的品牌宣传。

他表示,类似刘强东数字人的直播间他们已经卖掉了上万个,京东、淘宝、抖音、快手和视频号平台都有。“这个(数字人)行业发展的核心就是‘看不出来’。”既不会被观众一眼看出真假,也不容易被平台机器人识别出来以致封号。要达到这样的效果,他认为核心是让整个直播间符合图灵测试。“图灵测试1.0是分不清(是人类还是AI);图灵测试2.0则是双向情感交互;图灵测试3.0就是‘死生相契’,未来我们与AI之间,可能是Soul Mate(心灵伴侣)的关系。”

对于未来AI电商的形态,司马华鹏认为,未来更大的价值是专业性,数字人可以从数据、算法的角度给观众提供很多的专业性建议,给大家提供信用和信任,从而带来真正的、更好的电商交易。

京东言犀团队人士对记者表示,在内容生产方面,AIGC已成为了新时代的内容生产力。他指出,AIGC的“输出”需要预先“输入”大量的图文数据,因此AIGC无法创造出它所不了解的、从未接触过的、不存在的东西。比如顾客问洗衣机是多少升,是什么材质、性能如何,都有特定的答案,要从知识库中查阅。京东云自研领域知识大模型K-PLUG,给了AI丰富的电商通用知识库,让“采销东哥”对带货的商品“样样精通”,可回答直播间70%的常见问询,给出适合的商品推荐,应答准确率超90%。数字人还会借助大模型智能问答调优助手自我迭代,一方面根据商品详情页与脚本自动生成问答,一方面直播结束后自动补足没有覆盖的知识点,高效、实时地回答海量咨询。

■新快报记者 郑志辉