免费无限用！谷歌上线了一款AI语音转写神器|云端|知名企业|语音识别|语音转写|谷歌

智东西4月7日消息，谷歌今日悄然在iOS App Store上架了一款名为Google AI Edge Eloquent的语音听写应用。该应用免费且不限使用，默认基于本地的Gemma ASR模型完成语音识别、文本整理，无需联网，数据不出手机；同时也支持切换至云端由Gemini进行文本润色，在保障隐私的同时按需提升效果。

Eloquent还引入了个性化词汇机制，可基于用户常用表达建立专属词典，以提升识别准确率。

据The Next Web，这款应用没有发布会、没有博客说明，也未通过官方渠道提前预热，却在功能组合上与当前主流付费产品形成直接竞争。这款应用之后会有安卓版本，但目前还没有上架。

一、转录、润色、重写一站完成，端侧处理保隐私、云端增强提效果

具体来看，Eloquent的能力可以概括为语音转录、文本润色与结构化重写三类。这一过程将语音输入、整理和输出，压缩在一次操作中，减少了后期手动编辑的步骤。

打开Eloquent后，界面会显示一个带实时波形的听写区域。用户说话时，文本会同步生成。

用户暂停或结束输入后，系统会对语音内容进行处理，自动去除“嗯”“啊”等口头填充词，并对句子进行简单整理，让表达更接近书面文本。

处理完成的内容会自动复制到剪贴板，方便直接粘贴使用。

除核心转录功能外，Eloquent还提供四种文本转换工具：“要点”（Key points）将口述内容中的主要信息提炼为条目列表；“正式”（Formal）将转录文本改写为更专业的语体；“简短”（Short）对内容进行压缩；“详细”（Long）则对内容进行扩展。

历史记录选项卡保存所有此前的转录内容，每条均可单独删除。使用统计功能追踪累计字数和每分钟字数，这一细节面向那些希望量化自己实际口述产出的效率导向型用户。

在个性化方面，Eloquent还引入个人词汇字典机制，用户可以手动添加专有名词与行业术语，以提升识别准确率。

用户在登录谷歌账号后，还可以选择从近期Gmail邮件中导入高频词汇，自动建立个性化词汇档案，无需手动配置。这是整款应用中唯一涉及谷歌账号数据的功能，且完全可选。

这些功能背后的技术路径，是端侧优先加云端增强。Eloquent将处理能力尽量放在设备本地完成，其底层模型是谷歌自研的Gemma ASR，语音数据和个人内容无需离开手机，以保护用户隐私。

在云端模式下，语音识别仍在设备端启动，但文本润色由云端的Gemini模型完成。这种可切换机制，使用户在隐私与效果之间拥有选择空间，尤其适用于对数据流转敏感的使用场景。

二、免费无使用上限，支持iPhone本地离线转写

和市面上其他工具的不同之处在于，Eloquent支持在iPhone上本地离线处理，且完全免费、不设使用上限，这一组合正在对现有付费产品的定价逻辑形成压力。

当前主流语音转写工具大多采用订阅制，例如语音工具Wispr Flow与Willow月费约15美元，部分产品还需将音频上传至云端服务器处理。另一款强调隐私的Mac端应用SuperWhisper虽然支持本地运行，但仍需按年付费，且无法覆盖移动端场景。

Eloquent并未纳入谷歌常规的消费级产品体系，而是以Google AI Edge名义发布。该体系主要面向开发者，提供在Android和iOS设备上本地运行AI模型的工具与SDK。这一归属让Eloquent不只是一个面向用户的语音工具，也承担了展示端侧模型能力的角色，用于向开发者和企业说明Gemma在实际场景中的落地能力。

据The Next Web，过去一年主流科技公司正在加快推动AI模型向终端设备迁移，一方面出于隐私保护需求，另一方面也为了降低云端调用带来的延迟与成本。在这一趋势下，Eloquent将端侧语音识别与文本处理能力落在日常输入场景中，成为目前较为直接的落地案例之一。

此外，对于以Android为核心阵地的谷歌来说，Eloquent选择优先登陆iOS并不常见。过去谷歌在AI能力的发布路径上，通常会先在自有生态中落地，例如通过Pixel设备上的端侧模型或AI Edge相关SDK展示新能力，再逐步扩展到其他平台。

而此次在没有同步推出Android版本的情况下先上线iOS，让Eloquent更像是一场单独试水，而非成熟产品体系内的常规正式上线。

结语：免费与本地处理，Eloquent指向更低门槛的语音转写

Eloquent把端侧语音识别、文本自动整理和基础内容处理放在同一个流程里，同时提供完全免费的使用方式，并允许在本地完成核心计算。这种组合此前多出现在不同产品或付费版本中，如今被整合进一个无需订阅的移动端应用中，改变了语音转写工具的使用门槛。

Eloquent目前更像是Google AI Edge体系下的一次展示，其后续形态仍有待观察，例如是否会持续更新、是否扩展到Android并接入系统级输入场景。至少在现阶段，这款应用已经展示出一种更具体的方向，即将语音输入从云端服务转向设备本地能力，并以更低门槛进入日常使用场景。

来源：Google AI for Developers、The Next Web、TechCrunch