#可爱多一点,干爽多一点#

快速导读

Google悄悄发布了一款名为Google AI Edge Eloquent的离线语音输入应用,目前仅在iOS平台上线。这款应用基于Gemma模型打造,用户下载后即可免费进行离线语音输入,还能自动过滤”嗯”、“啊”等语气词。应用支持多种文本风格转换,云端模式则会调用Gemini进行优化。值得注意的是,安卓版本也在开发中,未来有望成为默认系统键盘。这意味着Google正式向语音输入市场发起攻势,苹果用户已经可以抢先体验。

打开网易新闻 查看精彩图片

低调上线直指语音输入市场

Google本周一悄然在App Store上架了一款名为Google AI Edge Eloquent的离线优先语音输入应用,目前仅面向iOS用户。这意味着苹果用户可以率先体验到这款完全免费、不依赖网络的语音输入工具。

这款应用的定位相当明确——与Wispr Flow、SuperWhisper、Willow等主流语音输入应用正面竞争。用户下载应用后,只需获取基于Gemma的自动语音识别模型,就能立刻开始使用手机进行语音输入。整个过程无需任何付费项目,Google这次显然想在语音输入市场分一杯羹。

有意思的是,尽管Google行事低调,但App Store的应用描述却透露出不少野心。官方写道,这是一款”旨在弥合自然语言与专业、可用文本之间鸿沟”的应用,号称能够自动删除用户说话时的”嗯”、“啊”以及自我纠正的内容,直接输出简洁准确的文字。

打开网易新闻 查看精彩图片

离线优先功能成最大亮点

对于很多用户来说,语音输入最让人头疼的就是网络延迟和隐私问题。Google AI Edge Eloquent的离线优先设计恰好解决了这两个痛点。应用开启后,用户可以随时查看实时转录的文本内容,点击暂停按钮后,系统会自动过滤掉语气词并对文本进行润色处理。

转录完成之后,用户还能对文本风格进行调整。应用提供了”要点”、“正式”、“简短”和”详细”四个选项,轻轻一点就能让同一段语音转变成不同风格的文字。用户也可以根据需要关闭云端模式,完全依赖本地处理——这对于注重隐私或者经常在信号不佳环境下工作的用户来说相当实用。

如果开启云端模式,应用会调用基于Gemini的云端模型对文本进行进一步优化。此外,用户还能从Gmail账户中导入特定的关键词、人名和行业术语,甚至可以添加自己的自定义词汇,确保专业场景下的识别准确率。

应用还贴心地记录了语音输入的历史会话,用户可以随时搜索过往内容。更详细的使用数据也在记录范围内——包括上一会话的输入词汇量、每分钟输入字数以及总输入字数,帮助用户了解自己的语音输入习惯。

Android版本已在路上

虽然目前只有iOS用户能下载使用,但Google显然没有忘记安卓阵营。App Store的应用描述中明确提到了Android版本的存在,甚至透露了一些尚未上线的新功能。

根据描述,Android版本的Eloquent将提供”无缝集成”功能,用户可以直接将其设为系统默认键盘,在任意文本输入框中全局使用。应用还将支持悬浮按钮功能,这与Wispr Flow在Android平台上的设计思路如出一辙,方便用户随时快速调用转录功能。

语音转文字技术近年来进步神速,AI驱动的转录应用正在吸引越来越多用户的关注。Google通过这款实验性产品加入战局,如果市场反馈积极,Android平台的转录功能有望在不久后得到进一步改善。

打开网易新闻 查看精彩图片