AI 范儿 · 产品拆解

语音输入用过一两次就放弃了?

不是你的问题,是工具还没到那一步。

你有没有试过用语音打字,说完一段话,看着屏幕愣了一会儿。

因为文字是对的,但逻辑是乱的。你说话跳来跳去,输入法老老实实都给你记下来了。

比如最近我有一个想做自媒体的朋友找我聊,我随口说了自己的想法。思维跳来跳去,没有事先整理。

我用微信的语音输入法,说完是这样的:

打开网易新闻 查看精彩图片

坦率说,看到这一堆文字我头都大了。我去整理花的时间,还不如我一开始就用文字来弄。

而且我自己还能整理,如果是发给别人(比如助理),那真的会让人崩溃吧。

但实际情况就是这样,我们说话不可能跟写文章一样,逻辑那么清晰,而且完全没有废话。

这就是为什么很多人,可能跟我一样,用过一两次语音输入之后,就再也不想碰了。

但这两天豆包上线了个豆包语音输入法。

01豆包输入法,先认识一下

玩过豆包的人应该都对它的语音识别能力叹为观止,比如跟老罗对话完全不带输的,它还能识别各种方言。

豆包输入法其实上线好几个月了,这两天增加了语音输入功能,官方的定位是"豆包同款语音输入"。

把做豆包 AI 时积累的那套语音模型,直接嫁接进了输入法里,这让我充满了想象和期待。

第一次打开会有点意外。界面非常干净,没有皮肤商城,没有弹窗广告,没有会员推广。

打开网易新闻 查看精彩图片

风格和 iOS 自带以及微信输入法接近,换过去几乎没有学习成本。

用过某些输入法的人懂那种"打个字先跳过广告"的烦躁感。豆包没有这个问题。

02回到那个案例,豆包会怎样?

我很急迫的想知道,同样是前面这个例子,豆包语音输入法会输出什么。

豆包的语音输入法跟其他的类似,会边说边转文字,就像同声传译一样。

这个输入法最终的输出是这样的:

打开网易新闻 查看精彩图片

说实话,看完我气都喘不过来。

但你不得不说,它记录的内容比微信输入法是多多了,识别率确实高了很多。

它甚至像个劳模,一字一句完全都记录下来了。

但你注意到没有,豆包的输出虽然准确,口水词还在,逻辑还是乱的。

密密麻麻,再次让人头大。甚至还有错别字,Agent 被识别成了 AIG。

这段话你能直接发出去吗?还是不行。

你还是要坐下来重新整理一遍,把核心观点提炼出来,把跳跃的思路理顺。

这件事,豆包没有帮你做。

一两句话可能无所谓,但有时候我们需要很长的对话,这种情况下那就真的让人头大了。

难道就没有一款真正好用的语音输入法吗?在回答这个问题之前,我们先聊另外一个话题。

03我们到底想要什么?

对于一个语音输入法,我们到底期待的是什么?

是期待它能把语音完全精准、一字不落地转成文字吗?就算你说方言,它也能精准转写?

我以前也以为,能做到这点,就已经是非常好的语音输入法了。

直到我遇到了另一款工具,我才明白:我们要的其实一直都不是精准的语音转文字。

我们要的是:真正能听懂人话、并说人话的工具。

哪怕你说得再怎么前言不搭后语、逻辑跳跃,它也能三言两语帮你把逻辑整理得一清二楚。

04Typeless 是什么感觉

Typeless 是一款让人用了就完全丢不掉的工具,它就是那样的产品,而且它还不止是那样的产品。

第一次用的时候,我的感受是:原来还能这样。

Typeless 跟其他语音输入法不一样,它不是边说边把语音转成文字(比如豆包、微信输入法)。

它会等到你把所有的话说完之后,经过快速整理再发出来。

还是同样那段乱说,Typeless 的输出是这样的:

打开网易新闻 查看精彩图片

这个输出简直绝了吧,一下子舒服了。

同样的一段话,它帮你记录了下来,理顺了逻辑、删除了废话,输出的是完全可以直接用的段落。(这个截图里面的文字以及格式我一点也没改)

它还有很多非常实用的细节,比如你说"明天上午十点,不对,下午三点开会",它输出"明天下午三点开会",不记录你的纠错过程,只给你最终结果。

它做的远远不只是识别更精准,而是真正听懂了你的意图。说完不需要再整理。

坦率说,我现在最爽的就是用 Claude,配上 Typeless。

我絮絮叨叨的说完一大堆的需求,Typeless 瞬间帮我理清了思路,发给 Claude 执行。

05它还不只是输入法

除了整理逻辑这件核心的事,Typeless 还有两个功能,让我觉得它的定位已经超出了"输入法"的范畴。

功能一

语音翻译

你说中文,它直接输出英文,或者其他任何语言。不是先转成中文再翻译,而是说完直接给你目标语言的版本。

更厉害的是,选中屏幕上一段已有文字,按快捷键说"翻译成英文",它就地替换。不需要打开翻译软件,不需要复制粘贴,不需要切换窗口。

功能二

✏️ 语音改写

选中一段文字,按快捷键,然后说"改得更正式一点",或者"把这段重新写得更简洁",它直接原地替换。

你的声音变成了一个可以操控文字的指令,在你正在用的任何软件里直接生效。

这两个功能合在一起,意味着 Typeless 不只能帮你"输入",还能帮你"编辑"。

06字节进场,会怎样?

说到这里,我反而多了一种担心,主要是对 Typeless 这类独立工具而言。

字节做豆包输入法,目前还停留在识别层,确实不是最理想的。

但以它的模型能力,往"理解意图"这个方向走,只是时间问题。

字节做产品有一个惯例:先占住入口,积累用户,然后快速加功能。豆包输入法现在的动作,很像是在打地基。

一旦它开始在语音输入里加入意图理解、逻辑整理、语音改写这些能力,而且免费打包在一个人人都装着的输入法里,Typeless 这种每月要收费的独立工具,生存空间会变得很窄。

这种事在 AI 这个领域,已经发生过很多次了。一个独立产品做出了真正有价值的东西,大厂跟进,免费,然后原来的市场基本消失。

所以:如果你现在有兴趣试 Typeless,我建议认真试一下。
https://www.typeless.com/downloads

趁它还是市场上体验最好的那个,等字节追上来,这个窗口就关了。

语音输入法真正的上限,
不是说得多准,
是说完之后还要不要再整理。从"听写员"到"理解者",这是下一关。

豆包输入法值得换过来用,识别够用,界面干净,免费。

但语音输入法真正的上限,不是说得多准,是说完之后还要不要再整理。这一关,豆包还没过。Typeless 过了。字节的眼睛,肯定已经看着那扇门了。

你用过语音输入吗?说完还得整理,是不是很抓狂?评论区聊聊你现在用什么输入法,够用吗觉得有用 → 点个❤️在看转给还不知道的朋友点个赞 告诉我你看完了关注「AI范儿」,下次更新第一时间收到