最近很多人的朋友圈都出现了一组对比图,一张是自己的照片,一张是AI绘画出的图片,有网友的AI绘画人畜不分,还有网友的AI绘画无中生“人”。AI绘画又火了,这次AI绘画的走红和当时盲盒的走红有异曲同工的特点,因为你根本不知道AI最后生成的图片究竟有多离谱,“驯服”AI也成为了数百万人想做的事情。
据了解,某AI绘画小程序排队使用的用户达到了8万,平台新注册的用户数更是在三天内增长了上百万。最近火爆的AI绘画便是你自己上传照片,输入关键词,便能通过AI合成照片对应的漫画图。
早在今年9月,AI绘画便成为了焦点。在美国科罗拉多州博览会的艺术比赛中,获得第一名的画作《太空歌剧院》便是用AI绘画工具生成的作品,看到以假乱真的AI绘画成片,当时便有人问:AI绘画都能获得第一名,元宇宙离我们还远吗?
纵使AI绘画因为版权问题还存在很多争议,但伴随着元宇宙概念的发展,AI绘画带来的市场前景不言而喻,根据6pen预测,若未来五年10%-30%的图片在AI的帮助下诞生,AI绘画则将创造超过600亿元的市场空间,若考虑到下一代互联网对内容需求的迅速提升,则可能创造更大的市场规模,面对如此市场前景,很多大厂如百度、谷歌等纷纷入局。
AI绘画是AIGC的一种,AIGC 即AI-generated content,是指通过 AI 技术来自动或辅助生成内容的生产方式,通过输入指令,人类让 AI 去完成冗杂的代码、绘图、建模等任务,从而生成内容。
既然画面可以用AI合成,那么声音呢?
除了AI绘画走红之外,同样隶属于AIGC概念的AI语音合成也一直在发展。
和AI绘画类似,目前的AI语音合成也能在用户输入关键词之后,生成对应类型的声音。比如当你输入“一头长发”,系统智能生成温柔大方的女性形象,声音端庄又不失甜美;输入“英俊潇洒”,生成有一些商务范的男生形象,声音略带磁性。这便是科大讯飞SMART-TTS的多风格多情感语音合成能力和虚拟人生成技术所能实现的。
如今在AI语音合成技术上具有头部地位的企业便是科大讯飞,多风格多情感合成系统SMART-TTS也是科大讯飞在语音技术合成上取得的新突破,无论是高兴、抱歉还是撒娇、悲伤,SMART-TTS系统都可以提供相对应情感的声音,目前可提供的情感有11种,还包括“严肃、困惑、害怕、鼓励、生气、安慰、宠溺”等,每种情感有20档强弱度不同的调节能力;也能提供声音的创造能力,如停顿、重音、语速等,可以根据自己喜好调节,还能适配不同的场景。科大讯飞曾表示讯飞开放平台将开放500个虚拟合成的声音。
目前科大讯飞语音合成技术代表的产品有讯飞有声,讯飞有声现在已经拥有60多位AI主播,导入文本、文字链接、图片、PDF或者word文档,你可以选择不同的声音来为你朗读,随时随地文字转语音,一键就能听。
有数据显示,到2030年,AIGC市场规模或将超过万亿人民币,而在AIGC领域占有重要市场的语音合成未来的市场前景不言而喻。无论是图片、文本还是语音,AI都已经渗入进去,以前畅想的AI未来世界已然到来。
(来源:新视线)
热门跟贴