近日,国内领先的数字科技公司集之互动宣布,其自主研发的数字人实时交互系统实现重大技术突破,从语音识别、大模型理解、精准控制、唇形驱动到语音合成,全流程响应时间缩短至0.8秒,达到行业领先水平。该技术的成熟,标志着数字人在“类人化”交互体验上迈出关键一步,也让数字人变得更加“聪明”。
集之互动CEO陆文斌表示:“0.8秒不仅仅是一个技术指标,更是数字人能否真正‘融入’业务场景的关键。我们致力于让技术不再成为体验的瓶颈,而是推动企业数字化转型的加速器。”
据了解,目前市场上能够实现实时交互且响应稳定的数字人服务商寥寥无几。集之互动凭借其在流式计算、端侧推理与AI模型优化方面的深厚积累,成功将语音识别、语义理解、表情与唇形驱动、语音合成等多个技术环节无缝衔接,形成高效闭环。该系统不仅响应速度快,更在唇形匹配的精准度,与语音自然度方面表现出色,让数字人的表达更加生动、真实。
该技术已成功应用于多个世界500强企业的实际业务场景中。例如,在医疗领域,集之互动为某知名医疗器械企业打造的数字人顾问,能够7×24小时不间断回答专业医学问题,极大缓解了医生重复性咨询的压力;在汽车行业,通过数字人孪生技术,销售人员仅需输入文本即可批量生成产品讲解视频,显著提升了内容生产与品牌传播效率。
除了技术速度的突破,集之互动在服务大型企业方面展现出独特的专业能力。针对500强企业、政府、金融及医疗等行业对数据安全的严苛要求,公司提供全栈式私有化部署解决方案。该方案支持从AI模型、交互引擎到数据后台的完整系统本地化部署,确保所有语音、视频及交互数据100%在企业内部网络闭环,彻底杜绝第三方平台数据泄露风险。这一能力已成功应用于党建数字人、国家对外文化贸易基地、临港管委会等高标准项目中,满足了等保、GDPR及行业监管要求。
此外,在跨境直播场景中,集之互动与AWS合作开发的SaaS平台,搭载该实时交互系统,支持400多种语言,帮助中小企业在出海过程中以更低成本实现多语种、高并发的直播营销,打破语言与地域的限制。
作为一家具备全栈自研能力的数字科技公司,集之互动已形成从数字人建模、内容生产到多场景落地的完整解决方案,并在金融、零售、党建、文化传播等多个领域树立了标杆案例。未来,公司将继续深耕实时交互与AIGC技术的融合,助力更多企业实现“数智化”升级。
热门跟贴