打开网易新闻 查看精彩图片

输入法正借助AI大模型,成为大厂竞争AI流量入口的新赛道。

6月28日消息, 智能纪元AGI 独家获悉,近期,阿里全面上线了两款AI输入法产品——千问输入法独立桌面版、CosyVoice桌面和iOS版。

尽管这两款输入法都是阿里巴巴研发,但分属两个业务部门。

其中,千问输入法是由阿里集团副总裁、C端千问总裁吴嘉团队研发,27日上线了mac桌面版,iOS 版也已进入内测阶段。

而CosyVoice则是To B端阿里云团队研发的,基于阿里开源语音合成模型的输入法产品,该模型最早是由前 阿里通义实验室语音团队负责人、达摩院创始“十三位扫地僧”之一鄢志杰领导团队研发,目前已上线mac版,27日上线了iOS版本。

两款产品的功能、交互和产品体验,都与豆包输入法几乎一致,甚至可以说,千问和 CosyVoice 直接瞄准“豆包输入法”进行竞争。

打开网易新闻 查看精彩图片

不仅如此,智能纪元AGI独家获悉,阿里云昨天正式上线了 Vibe Coding产品 Qoder的移动App版本,直接对标字节的 TRAE App,主要定位于在移动端同步进行AI Coding任务。

打开网易新闻 查看精彩图片

很显然,无论是聊天机器人豆包和千问,还是 输入法、AI编程、 云计算等,阿里和字节在AI领域的竞争加剧,几乎处于“肉搏”状态。

当然,不仅是豆包和千问,大厂已扎堆布局AI输入法赛道。

阿里云的AI语音输入法“CosyVoice”、千问的“千问输入法”、腾讯的“微信输入法”和字节的“豆包输入法”、科大讯飞的“讯飞输入法”等产品 都拥有AI大模型能力。

打开网易新闻 查看精彩图片

如今,很多大厂和创业公司都在加速抢夺 AI 办公场景的核心用户流量,而Mac顶部菜单栏,已然成为各家 AI 语音输入工具必争的前沿阵地。

打开网易新闻 查看精彩图片

语音输入法并非阿里或字节先创,早在二十多年前就已经出现了。

从最早的笨重机械打字机和电传打字机,到开创个人电脑时代的Apple II,键盘上的每个字符键和功能键都经历了重大变化,并且零星地分布在QWERTY键盘区域的角落里。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

科大讯飞(讯飞输入法)是全球首款原生主打语音输入的手机输入法,早在2010年10月就已经落地在手机设备,成为行业第一个把语音识别作为输入法核心能力的产品,并且拥有了第一批AI语音输入法的种子用户。

后来,微软、谷歌、苹果都开发了各自的系统输入法,将语音成为输入法当中的一个功能性选项。

相对于键盘输入,语音输入法拥有三个核心优势: 1. 输入效率大幅提升。普通人打字每分钟40–80字,口语可达每分钟150–300 字,速度是打字2–3倍;长文本、会议记录、随笔创作效率提升最明显。 2. 降低身体负担,解放双手。不用持续敲击屏幕或键盘,缓解腱鞘炎;走路、开车、做家务时可同步输入,不用低头盯屏幕;老人手指僵硬、视力差也更容易使用。 3. 适配中文痛点,识别更友好。中文同音字多、拼音选字繁琐,语音输入依托上下文自动区分同音词,支持方言、中英混说,不用纠结拼音拼写。

打开网易新闻 查看精彩图片

当然,过去十年,智能手机主导了数字生态系统,但智能手机从一开始就被设计成“供人盯着看”——它们所有的逻辑都止步于屏幕。

而且,语音输入法需要大量的语音和文字数据,很多人担忧隐私信息泄露,不敢使用语音输入法功能,仍依赖于从键盘到触控屏的输入。

因此,早期手机和系统自带仅有简单语音转文字工具,并非独立语音输入法产品,甚至很多人认为语音输入法效果不如预期,主要因为在GPT大模型热潮之前,NLP只能做特定的任务,无法做通用任务。

过去,输入法是依附于手机、电脑系统的基础工具,比拼的是词库储备、按键准确率、皮肤生态与输入流畅度,赛道格局常年固化,讯飞、搜狗稳居行业头部,几乎无新玩家突围空间。

但2023年ChatGPT掀起的通用人工智能浪潮,彻底改写了这一局面。

庞大的云端数据模型+CoT思维链技术,以及Whisper模型开源,让语音输入法产品有了更精准识别的技术底座。

而且,AI大模型与语音技术的深度融合,让输入法从“文字录入工具”进化为实时语义理解、内容创作、文本优化的人机交互入口

2023年8月,讯飞宣布首个在输入法内上线生成式 AI 创作助手,内置润色、扩写、智能回复,绑定自研星火大模型,语音输入同步联动大模型纠错、规整口语等。

与此同时,美国斯坦福创业团队研发基于Whisper+通用大模型开发桌面全局语音听写工具Typeless,成为海外最早主打「语音+大模型实时润色」的独立输入工具之一,下载量超千万,一度登上Product Hunt前排,好评如潮。

这个消息回到了国内。

2024年7月,微信正式入局,上线AI语音输入法,实现完整 AI 对话、AI 润色、语音大模型功能。

字节豆包则在2025年1月20日上线“豆包输入法”,初期仅在豆包聊天界面使用,非全局输入法,随后发布独立的输入法产品,使用豆包同款语音识别模型,错误率最多可降低约40%。

2025年初,Typeless竞品Wispr Flow在硅谷上线垂直 AI 语音输入法,公司累计融资 8100 万美元。 到了今年,随着千问成为阿里核心的AI助手产品,4月全面开始在千问里面内测输入法功能。

这样一来,千问、豆包、讯飞、搜狗、微信、智谱这些大厂,还有秘塔等初创公司,都加入了AI语音输入法赛道,相当热闹。

打开网易新闻 查看精彩图片

无论是以讯飞、搜狗、微信输入法为核心代表的传统存量升级派,还是国内豆包输入法、智谱AutoGLM、秘塔回响、通义千问输入法为代表的原生AI重构派,很显然,一场横跨海内外、新旧势力的输入法大战全面打响。

老牌厂商迭代革新,互联网大厂跨界入局,海外初创团队开辟新赛道,沉寂多年的输入法江湖,迎来史上最彻底的重构洗牌。

从手动打字到语音输入,从文字录入到AI创作,输入法的百年迭代,本质是人机交互方式的持续进化。

这场始于语音、终于智能的输入法革命,最终将实现“所思即所得、开口即成文”的终极交互形态,而小小的键盘输入窗口,也将成为人工智能落地大众、渗透全场景的核心入口。

打开网易新闻 查看精彩图片

艾媒咨询2026年数据显示,国内手机输入法用户规模已突破8.2亿,AI语音输入日常使用率从2023年的32%飙升至67%,越来越多用户放弃手动打字,选择“开口成文”。

AI语音输入正式从小众辅助功能,成为主流交互方式。

但问题在于,国内这一轮AI语音输入法基本处于“免费普惠、生态绑定”的核心特征,主要还是用入口换用户和流量,当然也有引导账号登录实现大模型功能。

当然,国内也有付费的输入法产品,如闪电说,需要用模型API调用或会员服务,实现更快速的反馈和技术功能。

打开网易新闻 查看精彩图片

然而,海外的Typeless、Wispr Flow却依然坚持限额免费+订阅付费体系,最低每月12美元。

其中,免费版仅提供基础小额听写额度;其他无限量语音输入、高级AI润色、自定义指令等功能,需要付费,从而实现产品商业化闭环,无需依赖生态引流,商业模式更纯粹、可持续。

因此,未来国内输入法赛道依然会面临两极分化格局:头部大厂依托生态与大模型能力,抢占大众通用市场,以免费、全能、轻量化为核心优势,垄断C端用户;初创厂商与垂直玩家深耕细分赛道,凭借定制化能力、付费服务或其他能力收割B端与高价值C端用户。

最后谈谈阿里与字节的竞争。

最近几个月,从简单的输入法功能,到AI电商、Agent服务等,甚至还有投流、舆情等,两家大厂竞争异常激烈。

QuestMobile数据显示,一季度豆包活跃用户增加1亿,千问增加1.26亿,排名从2025年11月的TOP6提升至TOP2。

打开网易新闻 查看精彩图片

数据还显示,截止到2026年3月,AI原生APP月活用户规模已达到4.4亿,其中,豆包、千问、DeepSeek位居前三位,月活用户规模分别为3.45亿、1.66亿和1.27亿,行业单季度新增超1.3亿用户。同时,三者在整个一季度的平均活跃率分别达到33.5%、17.1%、21%,显示出用户粘性在快速提升。

QuestMobile直接评价称:阿里巴巴旗下的通义千问与字节跳动的豆包是目前中国本土AI应用与大模型市场的两大头部竞争者。双方经历了从“拼流量入口”到“拼商业化与实际效能”的激烈角逐。

打开网易新闻 查看精彩图片

如今,连Vibe Coding赛道,两家公司也是竞争激烈,TRAE和Qoder功能迭代都十分相似。

近期火山引擎Force原动力大会主论坛上,字节跳动技术副总裁洪定坤用了接近40分钟讲TRAE这款产品,可以看出字节内部对于TRAE的关注和支持程度。

而阿里云的Qoder几乎每月都对外宣讲。

近期,TRAE和Qoder都加上了Design设计功能,直接对标Claude Design,引发了一波投流推广。

而国内Vibe Coding竞争加剧,背后的核心原因在于Claude Code和Codex拿到了用户的“心智”,使得全球开发者对于Vibe Coding的需求在增长。

OpenAI近期公布的一份报告显示,高达97.9%的活跃 OpenAI 员工使用 Codex,Codex 成为了工作相关 AI 使用的主要界面。

截至 2026 年 6 月 1 日,它占 Codex 和 ChatGPT 每周生成输出 token 的 99.8%;到 2026 年 5 月,80.6% 的抽样个人用户已经至少发出了一个 Codex 请求,该请求估计相当于超过 30 分钟的人工工作量。四分之一的用户发出了一个估计相当于超过八小时的请求。

洪定坤也指出,TRAE上的Token日均消耗量高达5.6万亿,Token日均消耗量同比去年增长50倍。

这说明,市场对于Vibe Coding需求在增加,但是否能替代Claude Code和Codex,还很难说。毕竟,Workbuddy和Qclaw也是这些产品的潜在对手。

从AI大模型、原生AI Agent应用、云与基础设施,到硬件、具身智能、投资生态等,大厂在不断在AI领域进行竞争。

除了阿里和字节,蚂蚁、京东等诸多互联网大厂都希望从AI身上寻找“第二重叙事”,因此,我认为,今年,这些大厂之间的AI竞争会更加激烈。

©本文为原创内容

未经授权,禁止转载