AI 正在悄悄改变人与电脑的交互方式,而下一个被重塑的,可能就是每天发生几百次的「输入」这个动作。

但用户的抱怨也从没停过。识别出来全是口语,「嗯、啊、那个、这个……」一个不落,语气词、停顿、口误,说完还得自己改一遍,兜了一大圈,效率并没提升多少。

而且很多工具和真正的办公场景脱节,重活都在电脑上干,语音工具却在手机里。

打开网易新闻 查看精彩图片

可以这么说,语音输入在这里不只是一个替代键盘的输入方式,相反成了触发整条工作流的开关。

目前,该功能已上线,我们可以下载千问电脑版或访问网页版直接体验,功能全免费、零门槛。

接下来我们就奉上一手实测,看看能开发出哪些提效玩法。

智能语音输入:打工人最强「嘴替」

先来试试智能语音输入。

我们将输入光标放在钉钉聊天框里,按住右 Alt(Mac 用户按住右 Command),对着电脑说一段完全口语化的内容,不停顿、不整理,就像跟朋友随口聊天那样说出来:

「就是啊,这个项目的话,我觉得吧,嗯,时间线要排一下,然后那个…… 对,就是周四之前要跟客户确认方案,然后内容那边也要催一催,不然可能来不及。」

打开网易新闻 查看精彩图片

千问语音输入法效果

以前写 prompt 要斟酌半天,现在可以随想随说。

比如口语输入一段复杂的提示词:

千问能分条缕析地理清需求,自动按框架分点输出,结构一目了然。

打开网易新闻 查看精彩图片

千问语音输入法效果

「王姐,问你个事儿呗,明天咱们的会是几点呀?我下午有个 Deadline,能不能往后 push 一下?哎呦,楼下新开了一家羊汤馆,挺好吃的。中午咱一块去吃饭去?」

打开网易新闻 查看精彩图片

千问语音输入法效果

「对话历史太长导致 Context Window 爆了。我想把 ConversationBufferMemory 换成 ConversationSummaryMemory,请给我一个用 LLM 自动 Summarize 历史消息的代码示例。」

打开网易新闻 查看精彩图片

千问语音输入法效果

智能语音指令:不用打字,开口说话就能办公

双击右 Alt(Mac 用户双击右 Command),则进入另一种模式 ——AI 语音指令。我们说什么,千问就能干什么,在任意软件、桌面任意位置均可唤起千问。

比如在邮件页面双击唤起,直接说:

「帮我写一封邮件,告诉客户方案延期两天,周五能交付,态度诚恳一些。」

打开网易新闻 查看精彩图片

千问语音输入法效果

如果觉得过于正式,再说一句「将邮件语气改得轻松一点」,千问直接重新生成,措辞到位无需手动修改。

打开网易新闻 查看精彩图片

千问语音输入法效果

而且它还能进行场景感知。同样一句语音指令「帮我回复下,说我可以」,在钉钉聊天框里,它输出的是:「收到啦!我会准时到达会议室哒~不见不散呀!」保留了即时通讯的口语感,末尾还自然带上表情。

打开网易新闻 查看精彩图片

千问语音输入法效果

切换到邮件界面再说同样的内容,话术则变成「收到,我会准时参加」,语气直接切换成商务书面表达。

打开网易新闻 查看精彩图片

千问语音输入法效果

同样的指令,它可以根据不同的场景,呈现出截然不同的表达风格。

千问智能语音指令还可以用来记便签,任何时候双击唤起,原话是:

千问电脑版能自动识别、记录并提供查看入口。

打开网易新闻 查看精彩图片

千问语音输入法效果

接下来我们再试几个进阶场景。

比如语音指令和千问内置的 PPT 功能联动。

千问 PPT 新增专业模式,由 Qwen 最新 AI 大模型编程能力加持,可动态生成复杂结构的 PPT 页面和内容,内容有深度,而且排版专业。

我们在钉钉里选中一段需求,双击快捷键,开口说:「帮我把这段需求整理成待办清单,再做成汇报 PPT。」

千问基于选中的内容,自动梳理逻辑、提炼要点,生成一份结构完整的 PPT。不需要复制粘贴、切窗口,更不需要手动排版。生成后还支持继续修改,直接在原 PPT 上调整,不用推倒重来。

打开网易新闻 查看精彩图片

千问语音输入法效果

语音指令搭配 Excel 也是需求极高的场景。

我们依然双击快捷键下指令,原话是:

打开网易新闻 查看精彩图片

千问语音输入法效果

整个过程里,我们只需说清楚要什么,执行层全部交给千问。对于日常需要维护各种数据表但又不擅长 Excel 的人来说,这种操作方式的门槛几乎为零。

支撑这一切的,是千问大模型多年沉淀的语音底层能力,包括超亿小时音视频数据训练、端到端的实时响应。扎实的技术底座,本就在等待一个足够日常、足够高频的落地出口。

它也把使用 AI 的流程压缩了。长按说话、双击下指令,AI 能力直接嵌在我们正在用的软件里,输入和执行之间没有断点,注意力也不会因为切换窗口而中断。

但在电脑端,这个转变才刚刚开始。桌面端的语音输入长期停留在转写工具的层面,没有与 AI 能力真正结合,千问电脑版语音输入法恰好做了一次尝试。

模型有多聪明,决定的是产品的上限。用户能用多自然的方式把意图传递给 AI,决定的是产品能否真正进入日常。

语音输入,正在成为 AI 交互的下一个入口。