打开网易新闻 查看精彩图片

算力如水,按需调度,秒级扩缩。

编辑 / 企鹅

年味越来越浓了。

AI 赛道的节点攻势已然全面铺开。各大企业纷纷摩拳擦掌,从视觉生成类的拜年特效,到工具类的短视频智能创作,希望在年度级的流量波峰中锁定更多用户增量。

而当千万级用户瞬间涌入时,请求排队、生成卡顿、页面加载失败……如果没有强大的算力做底座,结果往往只有两个:要么卡顿掉线,要么直接宕机。

可以说,后台算力底座的稳定性直接决定了业务成败。

并发请求一旦超出红线,如何扛住算力需求的瞬间暴涨,这也让许多 AI 企业犯了难。大多数传统云服务商,可能还没做好准备接住这波流量冲击。但服务响应的延迟会导致的结果却不等人:新用户流失,前期的获客成本也随之付诸东流。

据行业测算,仅除夕当晚,主流AI红包活动的交互量将突破千亿次,瞬时并发峰值或达 10 亿次/秒。每一次对话、每一帧生成、每一次交互,背后都是 GPU 集群的高速运转。

面对真实的“流量海啸”,全球 3D 内容应用头部企业Remy曾完成过一次漂亮的技术防守。

01.Remy:3D内容“全民化”应用

01.Remy:3D内容“全民化”应用

Remy 是 KIRI Innovation 旗下的产品,由创始人王正男(Jack)于 2018 年在加拿大多伦多创立。团队成立七年来,核心业务始终围绕“降低 3D 内容创作门槛”。从早期的手机外接 3D 扫描仪 Phiz,到 2021 年转型推出纯手机应用 KIRI Engine(利用 NeRF 等算法实现 3D 建模),再到 2024 年将高斯泼溅技术工程化并实现 9 天 100 万次的下载量,Remy 逐步降低了 3D 技术的专业门槛。

去年 Remy 曾在华为 HarmonyOS 6 发布会现场亮相。王正男现场演示了仅凭一段手机环绕视频,即可生成可在手机端查看的沉浸式 3D 空间。发布会结束后,Remy 的下载量便一路飙升,直冲华为应用市场第一。

打开网易新闻 查看精彩图片

高光时刻,也是生死考验。

用户量的快速增长使后台处理视频“3D 化”的算力需求大幅增加,对服务器构成了压力。对于创业公司而言,这种大规模的流量可以接入是业务增长的同时,对技术基础设施的考验:如果无法保证生成效率,可能会影响用户留存。

在此背景下,KIRI 的算力合作伙伴共绩科技启动了弹性调度机制。通过算力调度系统,共绩科技在 48 小时内将支持 Remy 的 GPU 集群规模从百卡扩容至 1900 张,保障了 50 小时内 50 万用户集中登录时的系统稳定性。

打开网易新闻 查看精彩图片

流量洪峰再猛,Remy 的用户体验依然丝滑,没有“掉链子”。这背后也是共绩科技的核心能力:极速、稳定的算力弹性扩缩容。

02.算力如水:按需调度,秒级扩缩

02.算力如水:按需调度,秒级扩缩

共绩科技的核心团队来自清华大学,其产品逻辑是构建一套弹性算力调度系统。这种架构能够适配 AI 应用在节假日或特定时段出现的周期性流量波动:

  • 秒级弹性:流量高峰来了,算力自动跟上;高峰过去,资源自动释放。你只需为实际使用量付费,无需为“可能用得上”的峰值容量提前买单。
  • 极致稳定:通过智能容错和高可用架构,保障关键任务SLA高达 99.99%。春节值守,用户可以更安心地关注业务本身。
  • 简单易用:提供 Serverless GPU 服务,支持 Docker 容器化一键部署,预置主流 AI 框架。用户无需关心底层运。

很多 AI 圈的同行习惯了传统云厂商的包年包月模式,为了春节那 1% 的突发流量,不得不闲置 99% 的算力资源,成本高昂且浪费严重。

在 AI 领域,面对春节等不确定性较高的流量峰值,固定资源配置往往带来冗余风险,弹性算力则成为业务连续性的关键。共绩的算力方案可以避免算力资源限制业务创新,并降低企业为应对极少数突发流量而承担的资源闲置成本。

春节期间的流量增长不仅是技术考验,也是提升市场份额的机会。这既取决于产品本身的吸引力,和底层基础设施的支撑水平——算力资源的储备与调度能力,直接影响高并发环境下的用户转化与留存。

类似 Remy 的扩容案例,预计将在今年春节期间的更多 AI 应用场景中出现。

与其应对高负载下的运维压力,或许提前优化算力保障方案也是一条不错的路径。通过共绩提供的弹性扩缩容技术,AI 应用可以更有效地应对春节期间的并发请求。

毕竟在 AI 行业的长期竞争中,维持稳定的用户体验是业务发展的核心基础。

排版运营 /Teagan

- End -