![](http://dingyue.ws.126.net/2024/1120/977713b6j00sn8bg800bwd000ps00ckp.jpg)
11月20日,昆仑万维正式推出「天工大模型4.0」4o版(Skywork 4o),以及新产品「实时语音对话助手Skyo」。
Skyo作为一个智能语音互动产品,具备快速响应、多语言对话能力,它能够主动发起对话、实时打断。同时,Skyo具备情感化反应和个性化声音定制功能,为用户带来温暖贴心的陪伴体验。
更重要的是,基于天工AI的大模型技术能力和AI搜索功能,Skyo能克服大模型幻觉问题,在对话中回复真实内容。无论在情感陪伴、个性化交互、多语言客服还是时事新闻聊天等应用场景中,都能提供智能且贴合需求的互动。
当前,昆仑万维旗下天工AI的应用功能矩阵涵盖AI搜索、AI文档-音视频分析、AI写作、AI音乐、AI图片生成、AI PPT。
实时语音对话助手Skyo的推出和加入,不仅让天工AI的生态矩阵更加立体、逐渐完善,也标志着端到端实时语音对话建模技术的重大进步。
01.
模型自研,打造端到端、更卓越的实时语音对话系统
在深入研究实时语音对话的过程中,目前仍存在一些痛点尚未被现有方案解决:全双工响应延迟较长、对话不够连贯、语音生成和交互体验不够自然,以及对多语言和情绪表达的支持不足。
昆仑万维则希望充分利用在AI大模型、AI音乐、AI搜索中的研发经验,提供更自然、更流畅、更拟人、低延时的用户交互体验。
「天工大模型4.0」4o版(Skywork 4o)以及Skyo具有深厚的语音和音乐大模型的技术经验以及大量语音数据积累。端到端自研先进链路,能在多任务下表现出色,尤其在高强度对话交互中仍能保持稳定性和流畅性。
「天工大模型4.0」4o版(Skywork 4o)模型优势:
- 高效响应速度:通过端到端的语音对话建模,实现低延迟响应,接近人对话的思考问答时间。
- 支持实时打断:用户无需点击对话开始和结束的按钮,全双工系统支持聊天中任意打断。
- 情感理解与个性化记忆:能够理解用户的情绪并提供情感化回应,对话更具人性化。
- 可定制的声音风格:支持用户定制或挑选助手的音色和风格。
- 有能力支持多语言:根据用户需求在多语言之间切换,适应全球化应用场景。
02.
产品亮点
基于模型能力和先进的端到端实时语音对话建模技术,Skyo颇具亮点,能实现以下功能:
- 能在1秒内回复、聊天中可打断:依托全双工+低延时技术,系统能随时聊天和打断,带给用户更自然对话感
- 主动交流:系统在检测到用户静默后,会主动发起聊天,并根据用户的历史偏好进行对偏好垂类的新闻进行语音播报
- 持续长对话:可支持跟用户长时间对话互动,在用户休闲、健身、出行途中进行可持续陪伴,成为用户的个人互动播客
- 情感反应:提供拟人化回复,会感受到用户情感进行回复
- 质感音色:更自然、更逼真的声音表达,并且实现情感和语调的高度还原
- 风格切换:支持用户定制声音风格,如选择专业新闻播报的男生音色、英姿飒爽的女生音色等
- 强大的记忆功能:能够在对话中追踪并回忆用户的偏好和历史信息,以提升多次对话的准确度
- 回复真实内容:具备实时资讯获知和知识拓展能力,与用户进行互动式交流
Skyo在发音准确度、音质表现和整体听感上的表现都非常出色,无论是主动问好、回答生活常识,还是让它做数学题、为我们提供一些日常建议,Skyo都可以迅速接住用户要求。如果不喜欢它的默认男声音色,还可以切换音色,以英姿飒爽的女声、温柔甜美的女声来回复用户。
同时,当你粗暴地打断它,“我不想听了”、“下一个话题”,或者什么都不说,直接切换到下一个问题,Skyo的情绪非常稳定,并且做到了立马停止上一个话题的回复,无缝切换到下一个对话中。
另外,Skyo对一些「严肃话题」和「实时新闻」的反应能力也相当不错,针对严肃话题和热点新闻,Skyo能回复真实内容,逻辑清晰、论点清晰、证据真实,既能对美国总统竞选给出一些资讯分析,也能对时隔三年携最新作品惊艳回归的李子柒做出点评。
除了“智商感”满满,Skyo的回答也颇具情商,在回答一些”充满陷阱”的问题时,它同样透露出一些小智慧。
面对“什么时候说谎是正确的选择”这样的哲学性问题,Skyo能为用户分析出“为了避免伤害他人感情、保护隐私等时候,说谎可能是一个合适的选择”。
当然,除了上述场景,Skyo还可以帮用户制定一次旅行计划、讲笑话、推荐周末的阅读清单等等。
但它的能力远不止于此,当用户疲惫或难过的时候,它也还可以做情感陪伴,当用户想了解和谈论近期热点事件时,它也能和用户来一场头脑风暴。
Skyo将于12月份上线昆仑万维旗下天工APP,一起期待~
热门跟贴