Google上周在iOS商店悄悄丢了个新东西——「Google AI Edge Eloquent」。没预热,没发布会,连官方博客都懒得写。这很Google:好东西先藏着,等用户自己挖出来。
但数据不会说谎。语音转写赛道里,Otter.ai月费16.99美元,Rev按分钟计费,苹果原生听写虽然免费,却离不开云端。Eloquent的打法像是个故意找茬的插班生:完全离线、零订阅、用量无上限。产品经理出身的我,第一反应是——这商业模式怎么跑通?
实时转写+一键润色:语音App的「两步走」
打开App,界面干净得不像Google出品。底部一个大红按钮,按住说话,波形图跟着跳动,文字实时蹦出来。松手后,真正的戏才开始——系统用几秒「思考」,把口语化的碎片整理成通顺文本,自动复制进剪贴板。
这个「暂停-整理」的设计很讨巧。市面上多数工具追求「边说边出字」,结果满屏语气词和断句灾难。Eloquent选择先录后理,牺牲3秒延迟,换来可读性跃升。工具栏提供四个变形选项:提取要点、正式化、缩短、扩充。我试了一段会议录音,「那个」「嗯」被批量清除,数据术语保留原样。
右上角有个开关,打开后进入「完全离线」模式。此时音频不出设备,连Google服务器都碰不到。代价是润色功能降级——本地模型 vs 云端Gemini的差距,大概相当于手机修图和Photoshop的区别。
个人词典:从Gmail偷师你的口头禅
语音转写的死穴是人名和行话。Eloquent的解法很产品经理思维:允许自建词典,还能登录Google账号,从近期发出的Gmail里抓取高频词汇。我的测试账号导入了37个专有名词,包括一家拼写诡异的丹麦客户公司名——转写准确率从「灾难级」拉到可用。
历史记录页按时间轴排列,支持删除和重新编辑。统计面板显示总字数、平均语速、使用时长,数据控会喜欢这种「量化自我」的颗粒度。但缺少文件夹分类和搜索,重度用户迟早会骂。
Google把这款App归类为「AI Edge」系列——专指端侧AI体验。同门师兄是AI Edge Gallery,一个让用户下载开源模型Gemma的实验平台。Eloquent的发布时机微妙:Gallery上周刚更新,支持Gemma 3的新版本。两款App共用一套端侧推理框架,技术复用的痕迹明显。
免费午餐能吃多久?
「无订阅、无上限」的承诺写在App Store副标题里,醒目得像挑衅。但Google的免费历来有条件。Eloquent的隐私条款埋着伏笔:离线模式关闭时,音频片段可能用于「改进服务」——翻译过来就是训练数据。
更现实的疑问是安卓版本。截至发稿,Play Store查无此App,Google发言人未回应平台独占原因。iOS优先的逆操作,在Google产品史上不多见。一种猜测是苹果设备的神经网络引擎(Neural Engine)标准化程度高,端侧部署成本更低;另一种更阴暗:先在小众平台试水,骂声小了再扩圈。
竞品们此刻的心情应该复杂。Otter.ai去年刚裁员30%押注企业市场,Rev的转写员时薪诉讼还没打完。Eloquent的免费策略像块石头丢进池塘,涟漪方向不明,但水里的鱼都感觉到了。
我注意到一个细节:App Store评分区有条中文评论,用户抱怨离线模式下「增强润色」按钮变灰,怒打一星。开发者回复称「云端Gemini需要联网,这是技术限制而非功能阉割」。这种坦诚在Google产品里罕见——通常他们选择沉默,等用户自己悟。
语音交互的终局是什么?是Siri式的全能管家,还是Eloquent这样的垂直工具?Google这次没给答案,只给了一个免费选项,和一道选择题:你愿意用隐私换便利,还是忍受离线模式的「笨」?
热门跟贴