实时互动与对话式AI的结合将成为未来业务发展的关键驱动力。
本文为IPO早知道原创
作者|Stone Jin
据IPO早知道消息,声网母公司 Agora, Inc. ( NASDAQ: API ) 于8月20日发布了2024年第二季度财报。
财报显示,本季度 Agora, Inc. 实现总营收3420万美元,同比增长0.5%。这也是在2021年Q4之后,10个季度以来 Agora, Inc. 首次实现营收同比增长。
其中,业务聚焦在中国市场的声网实现Q2营收1.32亿人民币,同比增长0.3%。聚焦非中国市场的 Agora 实现Q2营收1560万美元,同比增长2%。
对此,Agora, Inc.创始人兼CEO赵斌表示,"我很高兴看到声网和 Agora 在面对极具挑战的宏观环境下,本季度双双实现收入同比增长。这一成果得益于我们不懈的创新,一方面推动新应用场景落地,另一方面也提升成熟场景方案的质量和价值。我们最近帮助客户在多个应用场景中推出了对话式 AI 应用,如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服,并看到了不错的用户和用量增长。我相信,实时互动与对话式 AI 的结合将成为我们未来业务发展的关键驱动力。"
在这样的背景下,声网在本季度推出了 Linux Server SDK,支持当下大模型编程最主流的两类语言 Python 与 Go ,能够帮助开发者快速构建 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等实时 AI 应用场景。
发布 Linux Server SDK
帮助开发者快速构建实时AI应用场景
在多模态大模型的趋势下,RTE 成为了人与 AI 交互中的重要一环,越来越多的企业与开发者都在探索在大语言模型或者 AI 应用场景中快速集成高效的音视频能力。对此,声网推出了 Linux Server SDK,支持当下大模型编程最主流的两类语言 Python 与 Go ,企业可基于声网 Linux SDK ,快速接入大模型,上线具备 RTC 传输能力的 AI 应用场景,如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等。
声网 Linux Server SDK 以 API 的形式提供了一系列的功能,例如 Linux Server SDK for Go 可支持连接管理、信令发送、音频订阅与推送、事件回调通知等,其中信令传输能力不仅可应用于创建 DataStream 数据流,并发送信令,也能应用在大模型中发送数据流消息,例如将 TTS、STT 和 LLM 的结果发送给客户端。
此外,Linux Server SDK 还提供了使用时序的教程,从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述,帮助开发者快速上手。
持续优化产品性能与方案
打造最佳实时互动体验
近日,第33届夏季奥运会在巴黎闭幕。声网赛事直播解决方案在奥运会前新增 ABR (多码率观众端)能力,在保证低延迟的基础上,实现观众端码率多级、无缝、自适应平滑切换,为观众提供 0 卡顿、流畅的观看体验,可为体育赛事直播场景提供更高质量的直播效果与用户体验。
为帮助开发者快速集成高质量的泛娱乐社交实时互动场景,本季度,声网正式推出场景化 API 方案,该方案是面向客户业务场景化的一体化开发工具包,通过简单几个 API 就能快速实现场景构建,并通过预设参数配置帮助客户实现场景的最佳实践。
AV1 是一种新型的视频编码格式,设计初衷是为了提供一款免专利费,且具备更高效、更灵活视频压缩的编码器,以适应不断增长的在线视频需求,特别是在流媒体和实时音视频领域。目前声网 SDK 已接入 AV1 ,在实时音视频场景中,可实现同等码率下,视频编码效率大幅提升,视频画质更加清晰。
声网 AV1 的性能优势可以总结为:编码速度快、性能消耗低、同码率下画质更清晰、同画质下视频压缩率更高。此外,相比于H.264、H.265, AV1属于开放式的视频编码标准,不管是国内业务还是出海业务,都能快速接入。
联合多家伙伴
提升开发效率与便捷性
作为华为在 RTC 领域定向选择的核心厂商,6月21日,在华为正式发布鸿蒙 HarmonyOS NEXT Beta 版的同时,声网也同步发布了基于鸿蒙HarmonyOS NEXT Beta 版适配的 RTC SDK,并已在官网上线。适配鸿蒙HarmonyOS NEXT 后的声网 SDK,能支持频道管理、音视频基本功能、设备管理、数据流管理、媒体和流处理、视频增强、安全加密、事件和回调管理等几大块功能。
在场景搭建上,通过适配鸿蒙HarmonyOS NEXT 平台的声网 RTC SDK,可以全面满足开发者构建社交娱乐、在线教育、智能硬件、视频会议、协同办公、在线金融、线上医疗等广泛场景的需求,并能让开发者充分利用鸿蒙系统的特性,实现高效、稳定的通信体验。
7月,声网联合 Unity 中国正式发布了 UOS Hello 产品,该产品提供游戏内多人语音服务,并支持云录制,为开发者提供一站式、便捷、全球化、低延时、低功耗的游戏语音服务,降低中小型游戏工作室开发联机游戏的门槛。
相较于以往的音视频场景集成搭建,声网推出的场景化 API 具有更易、更快、更优的特点。目前,场景化 API 覆盖了 5 大泛娱乐业务场景,包含1v1呼叫、秀场直播 - 秒开秒切、秀场直播 - 美颜、音频最佳实践、K歌等,适用于企业期待快速完成开发上线的泛娱乐业务场景,并能跨级提升用户体验。UOS Hello 首个版本支持游戏语音、云录制,让开发者一站式集成,快速跑通基础功能。游戏模式上,UOS Hello 支持小队语音、开黑语音、国战指挥;功能上,会陆续上线空间音频、范围音频、Wwise 插件;同时,UOS Hello 还具有低延时、低功耗等特性,并对机型、平台适配全面。另外 UOS Hello 产品针对开发阶段的游戏项目提供 5000 分钟游戏语音以及 5000 分钟云录制免费时长。
热门跟贴