打开网易新闻 查看精彩图片

从公司创立到 IPO 上市,以及更广阔的全球布局,亚马逊云科技初创网络将为初创企业提供全生命周期的赋能服务,是中国初创企业的上云理想之选。云上初创》是亚马逊云科技初创网络打造的深度栏目,通过深入当下热门的生成式 AI 和行业赛道,致力于挖掘具有代表性的头部初创企业的独家故事,以及投资机构和意见领袖的深入洞见。本篇内容,将带您走进普强信息技术(北京)有限公司(以下简称“普强”),揭秘在智能语音领域,海外硅谷人才决定回国创业并取得突破成功的传奇故事。

三位创始人的华人赤子心

美国硅谷2009年诞生了一家智能语音领域的新星——普强。彼时,金融危机引发的行业萧条、投资困难,然而得益于海外华人圈的互帮互助,IC(集成电路)专家、EDA(电子设计自动化)之父黄炎松先生成为了支撑普强迈出第一步的关键人物。黄博士所专注的 IC 硬件领域,可作为语音入口,与普强的产品领域高度契合。

凭借着自研的生成式 AI 语音软件、应用和技术,三位联合创始人叩开了全球最大的电子设计自动化、半导体技术和解决方案公司 Cadence 的大门,双方认定语音交互将会在中国迎来广阔的需求,为了支持这项事业的发展,黄博士为普强提供了100万美元的天使投资。2010年,普强在北京中关村成立中国运营中心。尽管对国内语音识别领域发展空间大有信心,然而在初期开拓业务时,如何把天上飞的方法论落到地上跑的行业应用,成为了普强在中国站稳脚跟的全新挑战。

专注自主创新,深耕生成式 AI 语音技术赛道

刚回国时,普强处于探索阶段,企业发展也经历过艰难期。作为普强联合创始人兼 CTO,李全忠认为:“国内对生成式 AI 理解还在摸索期,且要面对集团巨头的竞争压力,所以技术的落地方向和寻找应用场景是当时迫切需要解决的问题。

2015年,一笔来自四维图新的投资为普强开启了车载领域的新大门,为普强搭建了多种车型的合作桥梁,同时借助上下游公司的合作,普强构建了包含汽车人机交互、线上线下服务、运营服务等在内的一整套人机交互解决方案,成为了改善用户体验的重要一环。2018年,普强的车载人机交互项目在横琴科创大赛斩获第一名的好成绩,并率先在全国部署了可以支持五千路并发的实时辅助系统。

通过不断摸索,普强全力攻关了广泛的语音交互技术领域,并在实际应用中取得了显著成效,如车载语音交互、运营商呼叫中心智能语音客服、金融机构智能质检等场景,融合了自动语音识别(ASR)、语音合成(TTS)、自然语言处理(NLP)等技术,从而保障语音系统的精准高效、稳定运行。

借助亚马逊云科技广泛而深入的云服务

实现业务快速部署

多年来,普强坚持自主研发,掌握核心技术,逐渐在生成式 AI 语音产业形成自己的产品壁垒和技术优势,同时也建立起自己的生成式 AI 大模型能力。随着业务的快速发展,普强对云服务的需求也持续增加,并且要求云服务能够更好地适配不断变化的生成式 AI 业务需求。亚马逊云科技拥有一整套云服务体系来推进创业公司的生成式 AI 能力建设,基于自身需求,普强正灵活地运用这套体系进行数据处理任务。

接触亚马逊云科技初创网络后,李全忠发现普强的一些技术栈完全可以利用亚马逊云科技 API 来实现,如语音识别服务、生成式 AI 模型服务,甚至还能为小语种地区用户提供准确的本地化人机交互语音服务。“软件和服务在云、SaaS 上运行是必然趋势,亚马逊云科技作为这一领域的‘鼻祖’,也为普强提供了低成本、快速部署业务的另一种路线。”李全忠如是说。

部署车厂的车载业务涉及多个模块,包括存储、网络、网关以及 ASR、TTS、NRU 等服务能力,会花费运维人员大量的时间和精力。应用亚马逊云科技之后,普强将语音合规地上传到服务器,存储在 Amazon Simple Storage Service(Amazon S3)上,ASR、NRU 服务可以通过 Amazon SageMaker 进行模型训练、模型数据标注和数据分析,加之亚马逊云科技技术专家专业、详细的指导,大幅降低了技术实施门槛和运维成本,提升了普强运维人员的技能和知识,项目部署上线时间较之前缩减50%以上。接下来,普强还计划应用 Amazon EC2、Amazon Lambda、OpenSearch、Amazon Bedrock 等稳定可靠的云服务,交付卓越的用户体验。

打开网易新闻 查看精彩图片

普强基于亚马逊云科技架构的示意图

通过融入亚马逊云科技初创网络,普强学习到了先进的维护模式,实现了业务应用的快速构建和部署,从技术方面提高了生成式 AI 产品力,能够更专注于产品研发和业务创新。同时,可以利用亚马逊云科技全球资源和合作伙伴体系,获得更多联合营销及业务发展的机会,接触到更多的潜在客户和商机,加速企业成长并拓展影响,让普强能够更加自信地走向世界。李全忠表示:“亚马逊云科技初创网络,是创业者实现技术突破、市场拓展与生态链接的强大引擎,助力创新梦想照进现实。”

投资人洞见

“智能语音技术是实现人机语音通信的关键,其次智能语音技术已经广泛应用于多个领域,普强涉及的场景应用像车载、运营商、客服、酒店、政务等领域,都有发挥重要作用。

生成式 AI 引爆人工智能新一轮应用热潮,其感知能力、认知能力、生成能力正重构人机交互方式,推动语音行业向更加智能化、个性化和自然化的方向发展。通过与多种模态进行结合,如图像、文本、手势等,为语音行业带来更多的可能性。”

——和高资本创始合伙人 何宇华

2024年5月29日-30日,

亚马逊云科技中国峰会盛大开启,

普强将亮相初创网络展区,

带您近距离感受智能语音的创新魅力。

打开网易新闻 查看精彩图片

让我们共同见证亚马逊的一小步

云计算的一大步

打开网易新闻 查看精彩图片