打开网易新闻 查看精彩图片

AI 陪伴逐渐融入人们的日常生活,头部泛娱乐app包括TT语音、Soul等推出 AI 分身、 AI 宠物、AI 伴侣玩法;星野、C.AI、筑梦岛、Poly.AI等原生AI应用受Z世代喜爱,年轻人开始跟 AI 谈赛博恋爱……根据 A16Z 的8月份最新报告,Top100的app中,16%的产品为 AI 陪伴类产品,且占top20中的6个。

在技术发展层面, AI 运用在虚拟伴侣、虚拟咨询等 AI 陪伴场景的能力越来越强。从openAI的o1模型,具备更强的逻辑和推理能力,初步展现出“系统2”的慢思考能力,到国内外各家厂商陆续推出视频、音乐等模态大模型,显示出大模型的能力和效果均在快速发展,这无疑会极大地助力 AI 的运用。

与此同时,大模型价格逐步下降,让 AI 落地应用的商业可行性更高。今年以来,5月份通义千问、豆包、MiniMax等模型大幅降价,9月份云栖大会上通义千问再次降价……

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

社交应用试水「AI 陪伴」,需要考虑哪些?

当用户的接受程度已经验证,且技术成熟度提高、使用成本降低的情况下,各大社交应用只需要寻找相应的落地的细分用户群体及业务场景,寻找PMF(产品匹配市场),来更好的满足现有用户需求或者找寻新的市场。

那么,对于想要试水 AI 的泛娱乐社交应用来说,如果从0搭建整套 AI 陪伴场景,需要经历哪些步骤?

近期即构科技受邀参加《云栖大会》,围绕以上话题,为客户、伙伴做了相关分享。

试水「AI 陪伴」,可能遇到哪些难点?

1. 首先是接入方面,通常需要2个月以上,成本相对较高:

  • 接入多家厂商的语音识别(ASR)、语音合成(TTS)、大语言模型多个产品;

  • 服务端高可用性的复杂逻辑开发、处理大量请求的性能优化、全球部署的资源成本等;

  • 还需接入搭配 RTC等实时互动产品,并将AI融入到1v1、语聊房等场景。

2. 在成本高企的情况下,效果还难保证:

  • AI回应延迟过高,>4s;

  • 角色生硬,机械感十足;

  • 角色、人设单一。

打开网易新闻 查看精彩图片

即构「AI陪伴」解决方案

2周接入,情绪价值实时提供

在洞悉到客户痛点后,即构推出「AI陪伴」解决方案——控制成本,能在 2 周左右快速接入,抢占市场先机,并且能保证效果,还原真实人物性格、语气,给予用户情感反馈体验。该方案适用于AI伴侣、剧情演绎、虚拟咨询、克隆主播等常见场景。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

左右滑动查看更多场景

即构「AI陪伴」在效果方面,具备以下特征:

AI 互动优质体验

多模态交互能力:用户可以通过文本、语音等多种交互方式与AI进行互动。

自然语音打断 AI:就像和人对话一样,用户可以随时打算 AI 的说话内容,开启下一个话题。

超低延迟的沉浸式体验:文字互动延迟500ms以内,语音互动最低至1s(用户说完话到听到AI回复)。

人设丰富“千人千面”

人设、经历等个性化角色:可定义 AI 的性格、人设,满足自己的专属需求。

可扩展数字人形象:2.5D、图片数字人,赋予 AI 以形象。

精准拟人的内容反馈:回答内容符合人设定位。

自然人声情感体验

百变的音色选择:多家厂商总共近百种的音色可选。

极速的音色复刻:30s即可快速复刻音色。

丰富的情绪展现:根据人设、语境,像人一样做出带有不同情绪的回复。

扫码即可获取即构「AI 陪伴」体验demo

打开网易新闻 查看精彩图片

即构「AI 陪伴」方案技术优势

最快2周内,即可完成与AI的IM聊天及语音通话的场景接入,客户只需要专注于业务层面的AI的角色打造及场景运营等。

1. 高可用的服务端AI Agent虚拟用户,降低开发门槛和时间

(1)基于MSDN全球覆盖的传输网络,结合高可用后台服务,实现各种网络、地区等情况下最低1s的AI互动延迟,自然语音打断AI。

(2)提供语音识别(ASR)、语音合成(TTS)、数字人等多模态插件选择及调整,自主选择AI Agent应用的插件厂商,并选择更合适的语种、音色等,让AI Agent的角色全面适应不同地区、场景的多样性需求。

(3)兼容国内外大模型,openAI、MiniMax、通义千问、豆包等各个厂商大语言模型,且支持开源模型。

(4)基于AI的应用场景,通过Prompt 最佳实践,结合 RAG、LoRA 等方式,更好的匹配 AI 角色。

2. 支持多种客户端接入形式,帮助客户快速跑通客户端逻辑

UIKits——

更轻松、便捷的低成本选择,属于通话、互动聊天等含UI的场景化SDK。

(1)免去1v1互动单聊、与AI音视频通话的通用场景搭建成本。

(2)可基于丰富的UI组件针对UI快速配置调整。

基础SDKs——

更多能力的高级定制选择,属于实时音视频、即时通讯等不含 UI 的SDK。

(1)通过按需接入高级能力、灵活裁剪SDK,实现性能和效果的极致体验。

(2)UI可完全自定义,从而支持更丰富复杂的业务玩法。

(3)全面覆盖各类型互动场景,实时音视频、即时通讯等10+互动产品,300+ API自由调用组合。

更多产品详情,欢迎扫码咨询 ‍ ‍ ‍ ‍