AudioShake源自东京的一家卡拉OK酒吧。

杰西卡·鲍威尔生动地回忆起与她的朋友卢克·迈纳一起唱歌时,他们不停地问:“为什么卡拉OK歌曲书这么薄?为什么我们没有世界上所有的歌曲?如果你能随心所欲地唱任何一首歌,那该多好啊!”

那是在2013年。鲍威尔和迈纳直到2021年才共同创办AudioShake——一家专注于音频分离和处理技术的公司。鲍威尔以独特的视角踏入初创公司的创始人行列:她在2007年至2018年期间在谷歌工作,最终负责这家搜索巨头的沟通工作(迈纳是一名数据科学家,曾在Plaid工作)。自2021年以来,鲍威尔一直担任AudioShake的首席执行官,在ChatGPT问世和语音AI进入主流之前,她就已经在企业中使用专注于音频用例的AI。

鲍威尔告诉财富:“我们试图做的是让音频对人类和机器都可用。这可能意味着一些非常有创意的工作流程,比如电影和音乐的编辑。但这也可以意味着机器必须做的事情,比如能够理解现实世界的音频。”

AudioShake目前已有超过40家企业客户,最近完成了由Shine Capital领投的1400万美元种子轮融资。(汤森路透风险投资、Origin Ventures、Indicator Ventures和Precursor Ventures也参与了此次融资,使这家初创公司的总融资额达到了1900万美元)。Shine的普通合伙人亚历克斯·哈茨称赞鲍威尔是一位“结合了坚韧的初创公司创始人和经验丰富的高管最佳特质的音响爱好者。”她确实在快速发展的市场中与企业客户建立了联系——目前的AudioShake客户包括环球音乐、迪士尼音乐集团、华纳音乐集团、华纳兄弟探索、BET和NFL影片,以及“几家壮丽七号公司”。正如鲍威尔所说,无论是在电影还是在工厂车间,都存在许多极其复杂的音频环境。

“我们专注于声音,”鲍威尔说。“很多声音实际上是丰富而美丽的声音。它可以是电影或一段音乐。但音频有很高的频率重叠,并且有很多未知的混合条件。这些都是你试图解决的技术挑战。”

YC支持的AI音频工作室Wondercraft的内容和社区负责人Filipa Olmo表示,该公司使用AudioShake将文件分解为“单独的音频组件,这使我们的用户能够使用我们的工具和声音进行编辑和自定义。”Olmo将AudioShake的技术描述为“基础性”,并表示该初创公司是“我们找到的唯一能够满足我们质量要求的提供商。”这涉及到一个重要的问题:音频市场可能是一个巨大的、未被看到的市场。

Shine的Hartz通过电子邮件表示:“音频市场庞大,并且与视频市场相比,出乎意料地更大。”他说:“通过使音频编辑变得像图像一样简单,AudioShake有机会成为所有音频使用案例的核心基础设施。”

Term Sheet问鲍威尔:接下来会发生什么?

“人类和机器有不同的特长,如果你能让彼此拥有对方的特长,那将是非常强大的,”她说。“如果你能让人类像机器一样编辑声音,这将带来更多的创造机会。如果你能帮助机器理解同时发生的多种声音的含义,那将有助于让机器为人类服务,完成我们可能不想做但今天无法交给机器的各种任务……如果机器能像人类一样看和听,它们可以做很多事情。”

艾莉·加芬克尔

社交媒体:

用户名:@agarfinks

邮箱: alexandra.garfinkle@fortune.com