智东西编译 陈佳编辑 程茜
打开网易新闻 查看精彩图片
智东西编译 陈佳编辑 程茜

智东西4月7日消息,谷歌今日悄然在iOS App Store上架了一款名为Google AI Edge Eloquent的语音听写应用。该应用免费且不限使用,默认基于本地的Gemma ASR模型完成语音识别、文本整理,无需联网,数据不出手机;同时也支持切换至云端由Gemini进行文本润色,在保障隐私的同时按需提升效果。

Eloquent还引入了个性化词汇机制,可基于用户常用表达建立专属词典,以提升识别准确率。

打开网易新闻 查看精彩图片

据The Next Web,这款应用没有发布会、没有博客说明,也未通过官方渠道提前预热,却在功能组合上与当前主流付费产品形成直接竞争。这款应用之后会有安卓版本,但目前还没有上架。

一、转录、润色、重写一站完成,端侧处理保隐私、云端增强提效果

具体来看,Eloquent的能力可以概括为语音转录、文本润色与结构化重写三类。这一过程将语音输入、整理和输出,压缩在一次操作中,减少了后期手动编辑的步骤。

打开Eloquent后,界面会显示一个带实时波形的听写区域。用户说话时,文本会同步生成。

用户暂停或结束输入后,系统会对语音内容进行处理,自动去除“嗯”“啊”等口头填充词,并对句子进行简单整理,让表达更接近书面文本。

处理完成的内容会自动复制到剪贴板,方便直接粘贴使用。

打开网易新闻 查看精彩图片

除核心转录功能外,Eloquent还提供四种文本转换工具:“要点”(Key points)将口述内容中的主要信息提炼为条目列表;“正式”(Formal)将转录文本改写为更专业的语体;“简短”(Short)对内容进行压缩;“详细”(Long)则对内容进行扩展。

打开网易新闻 查看精彩图片

历史记录选项卡保存所有此前的转录内容,每条均可单独删除。使用统计功能追踪累计字数和每分钟字数,这一细节面向那些希望量化自己实际口述产出的效率导向型用户。

在个性化方面,Eloquent还引入个人词汇字典机制,用户可以手动添加专有名词与行业术语,以提升识别准确率。

用户在登录谷歌账号后,还可以选择从近期Gmail邮件中导入高频词汇,自动建立个性化词汇档案,无需手动配置。这是整款应用中唯一涉及谷歌账号数据的功能,且完全可选。

打开网易新闻 查看精彩图片

这些功能背后的技术路径,是端侧优先加云端增强。Eloquent将处理能力尽量放在设备本地完成,其底层模型是谷歌自研的Gemma ASR,语音数据和个人内容无需离开手机,以保护用户隐私。

在云端模式下,语音识别仍在设备端启动,但文本润色由云端的Gemini模型完成。这种可切换机制,使用户在隐私与效果之间拥有选择空间,尤其适用于对数据流转敏感的使用场景。

二、免费无使用上限,支持iPhone本地离线转写

和市面上其他工具的不同之处在于,Eloquent支持在iPhone上本地离线处理,且完全免费、不设使用上限,这一组合正在对现有付费产品的定价逻辑形成压力。

当前主流语音转写工具大多采用订阅制,例如语音工具Wispr Flow与Willow月费约15美元,部分产品还需将音频上传至云端服务器处理。另一款强调隐私的Mac端应用SuperWhisper虽然支持本地运行,但仍需按年付费,且无法覆盖移动端场景。

Eloquent并未纳入谷歌常规的消费级产品体系,而是以Google AI Edge名义发布。该体系主要面向开发者,提供在Android和iOS设备上本地运行AI模型的工具与SDK。这一归属让Eloquent不只是一个面向用户的语音工具,也承担了展示端侧模型能力的角色,用于向开发者和企业说明Gemma在实际场景中的落地能力。

据The Next Web,过去一年主流科技公司正在加快推动AI模型向终端设备迁移,一方面出于隐私保护需求,另一方面也为了降低云端调用带来的延迟与成本。在这一趋势下,Eloquent将端侧语音识别与文本处理能力落在日常输入场景中,成为目前较为直接的落地案例之一。

此外,对于以Android为核心阵地的谷歌来说,Eloquent选择优先登陆iOS并不常见。过去谷歌在AI能力的发布路径上,通常会先在自有生态中落地,例如通过Pixel设备上的端侧模型或AI Edge相关SDK展示新能力,再逐步扩展到其他平台。

而此次在没有同步推出Android版本的情况下先上线iOS,让Eloquent更像是一场单独试水,而非成熟产品体系内的常规正式上线。

结语:免费与本地处理,Eloquent指向更低门槛的语音转写

Eloquent把端侧语音识别、文本自动整理和基础内容处理放在同一个流程里,同时提供完全免费的使用方式,并允许在本地完成核心计算。这种组合此前多出现在不同产品或付费版本中,如今被整合进一个无需订阅的移动端应用中,改变了语音转写工具的使用门槛。

Eloquent目前更像是Google AI Edge体系下的一次展示,其后续形态仍有待观察,例如是否会持续更新、是否扩展到Android并接入系统级输入场景。至少在现阶段,这款应用已经展示出一种更具体的方向,即将语音输入从云端服务转向设备本地能力,并以更低门槛进入日常使用场景。

来源:Google AI for Developers、The Next Web、TechCrunch

打开网易新闻 查看精彩图片