声网母公司Q2总营收3420万美元，10季度以来首次实现同比增长|agora|sdk|业绩报告|声网|奥运会|总营收

实时互动与对话式AI的结合将成为未来业务发展的关键驱动力。

本文为IPO早知道原创

作者｜Stone Jin

据IPO早知道消息，声网母公司 Agora, Inc. ( NASDAQ: API ) 于8月20日发布了2024年第二季度财报。

财报显示，本季度 Agora, Inc. 实现总营收3420万美元，同比增长0.5%。这也是在2021年Q4之后，10个季度以来 Agora, Inc. 首次实现营收同比增长。

其中，业务聚焦在中国市场的声网实现Q2营收1.32亿人民币，同比增长0.3%。聚焦非中国市场的 Agora 实现Q2营收1560万美元，同比增长2%。

对此，Agora, Inc.创始人兼CEO赵斌表示，"我很高兴看到声网和 Agora 在面对极具挑战的宏观环境下，本季度双双实现收入同比增长。这一成果得益于我们不懈的创新，一方面推动新应用场景落地，另一方面也提升成熟场景方案的质量和价值。我们最近帮助客户在多个应用场景中推出了对话式 AI 应用，如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服，并看到了不错的用户和用量增长。我相信，实时互动与对话式 AI 的结合将成为我们未来业务发展的关键驱动力。"

在这样的背景下，声网在本季度推出了 Linux Server SDK，支持当下大模型编程最主流的两类语言 Python 与 Go ，能够帮助开发者快速构建 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等实时 AI 应用场景。

发布 Linux Server SDK

帮助开发者快速构建实时AI应用场景

在多模态大模型的趋势下，RTE 成为了人与 AI 交互中的重要一环，越来越多的企业与开发者都在探索在大语言模型或者 AI 应用场景中快速集成高效的音视频能力。对此，声网推出了 Linux Server SDK，支持当下大模型编程最主流的两类语言 Python 与 Go ，企业可基于声网 Linux SDK ，快速接入大模型，上线具备 RTC 传输能力的 AI 应用场景，如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等。

声网 Linux Server SDK 以 API 的形式提供了一系列的功能，例如 Linux Server SDK for Go 可支持连接管理、信令发送、音频订阅与推送、事件回调通知等，其中信令传输能力不仅可应用于创建 DataStream 数据流，并发送信令，也能应用在大模型中发送数据流消息，例如将 TTS、STT 和 LLM 的结果发送给客户端。

此外，Linux Server SDK 还提供了使用时序的教程，从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述，帮助开发者快速上手。

持续优化产品性能与方案

打造最佳实时互动体验

近日，第33届夏季奥运会在巴黎闭幕。声网赛事直播解决方案在奥运会前新增 ABR （多码率观众端）能力，在保证低延迟的基础上，实现观众端码率多级、无缝、自适应平滑切换，为观众提供 0 卡顿、流畅的观看体验，可为体育赛事直播场景提供更高质量的直播效果与用户体验。

为帮助开发者快速集成高质量的泛娱乐社交实时互动场景，本季度，声网正式推出场景化 API 方案，该方案是面向客户业务场景化的一体化开发工具包，通过简单几个 API 就能快速实现场景构建，并通过预设参数配置帮助客户实现场景的最佳实践。

AV1 是一种新型的视频编码格式，设计初衷是为了提供一款免专利费，且具备更高效、更灵活视频压缩的编码器，以适应不断增长的在线视频需求，特别是在流媒体和实时音视频领域。目前声网 SDK 已接入 AV1 ，在实时音视频场景中，可实现同等码率下，视频编码效率大幅提升，视频画质更加清晰。

声网 AV1 的性能优势可以总结为：编码速度快、性能消耗低、同码率下画质更清晰、同画质下视频压缩率更高。此外，相比于H.264、H.265， AV1属于开放式的视频编码标准，不管是国内业务还是出海业务，都能快速接入。

联合多家伙伴

提升开发效率与便捷性

作为华为在 RTC 领域定向选择的核心厂商，6月21日，在华为正式发布鸿蒙 HarmonyOS NEXT Beta 版的同时，声网也同步发布了基于鸿蒙HarmonyOS NEXT Beta 版适配的 RTC SDK，并已在官网上线。适配鸿蒙HarmonyOS NEXT 后的声网 SDK，能支持频道管理、音视频基本功能、设备管理、数据流管理、媒体和流处理、视频增强、安全加密、事件和回调管理等几大块功能。

在场景搭建上，通过适配鸿蒙HarmonyOS NEXT 平台的声网 RTC SDK，可以全面满足开发者构建社交娱乐、在线教育、智能硬件、视频会议、协同办公、在线金融、线上医疗等广泛场景的需求，并能让开发者充分利用鸿蒙系统的特性，实现高效、稳定的通信体验。

7月，声网联合 Unity 中国正式发布了 UOS Hello 产品，该产品提供游戏内多人语音服务，并支持云录制，为开发者提供一站式、便捷、全球化、低延时、低功耗的游戏语音服务，降低中小型游戏工作室开发联机游戏的门槛。

相较于以往的音视频场景集成搭建，声网推出的场景化 API 具有更易、更快、更优的特点。目前，场景化 API 覆盖了 5 大泛娱乐业务场景，包含1v1呼叫、秀场直播 - 秒开秒切、秀场直播 - 美颜、音频最佳实践、K歌等，适用于企业期待快速完成开发上线的泛娱乐业务场景，并能跨级提升用户体验。UOS Hello 首个版本支持游戏语音、云录制，让开发者一站式集成，快速跑通基础功能。游戏模式上，UOS Hello 支持小队语音、开黑语音、国战指挥；功能上，会陆续上线空间音频、范围音频、Wwise 插件；同时，UOS Hello 还具有低延时、低功耗等特性，并对机型、平台适配全面。另外 UOS Hello 产品针对开发阶段的游戏项目提供 5000 分钟游戏语音以及 5000 分钟云录制免费时长。