这是苍何的第 526 篇原创!

大家好,我是苍何。

我最近玩了好多 AI 硬件啊,甚至有一种癫狂的地步。

我的好朋友 TRAE 最近又送了个好玩的东西给我,它叫影石 Insta360 Mic Air。

打开网易新闻 查看精彩图片

这是 TRAE 和 Insta 360(影石)联名的麦克风,我跟你说句实话,我收到打开的时候光被这个颜值,我就爱不释手了。

先来个题外话,TRAE 的产品设计真的是顶级的审美,我那天在 X 随便发了个帖子,一堆人却看上了 TRAE 送我的键盘

打开网易新闻 查看精彩图片

讲真的,你们现在看我能打字 BB 这么久,多多少少有键盘的一份功劳,我是个颜值控。

不过说实话,自从体验了 Mic Air 的语音输入之后,键盘用的频率明显少了,毕竟动嘴比动手快太多了。

跑偏了,实际使用下来,其实更兴奋,所以,我必须抽时间,录了好多个视频,好好给你分享我的喜悦,以及我所看到的一点思考。

另外我非常推荐你阅读完这一篇文章,因为文末会有方式给大家送 SOLO 邀请码。

先说说为什么是影石。影石 Insta360 在运动相机和全景相机领域,懂的都懂,音频采集这块本身就是他们的强项。

打开网易新闻 查看精彩图片

而 Mic Air 的参数也确实对得起这个联名,48kHz 采样率加上 24bit 位深,说人话就是,你哪怕小声嘀咕,它也能听得一清二楚。

再加上 AI 降噪,在咖啡厅这种嘈杂环境下,也能把你的声音精准拎出来。

7.9g,硬币大小,往衣领上一夹,基本就忘了它的存在。

打开网易新闻 查看精彩图片

说白了,TRAE 选影石合作,就是因为语音输入这件事,收音质量直接决定了指令识别的准确率。麦克风不行,后面的 AI 再强也白搭。

我主要想给大家演示一下他的 AI 能力,以及和 TRAE SOLO 这款产品的丝滑融合。

上来,我先录个视频给大家介绍下 Mic Air ,我就不露脸了,毕竟我要给你们看的是麦克风而不是我帅气的脸。

你看到了吗?我对着 Mic Air 一顿口喷,说了一堆废话,它自动帮我做了口语清洗,去除了语气词(嗯、然后、那个)、去除了重复词。

我先打开的是他的 MTC 模式,也就是 More Than Coding 了,主要是 SOLO 处理办公任务。

我让它去搜集全网关于 DeepSeek V4 相关的信息,但是一时语塞说了一些嗯、啊、那个这样的废话。

Mic Air 最终自动去除了这些,做了精简转化,聚焦于核心。

打开网易新闻 查看精彩图片

我甚至直接丢给了它 DeepSeek 刚发布的关于 V4 的技术论文,让 SOLO 来翻译总结。

搭配 Mic Air 后,指令更加精准了,这个出来的效果也直接符合。

好,现在有了相关的调研以及技术论文,我希望让 SOLO 去帮我基于刚才了解到的信息和总结的技术论文,去帮我写一篇技术文章。

我的做法是直接对着我衣领的麦克风口喷,这一刻,我仿佛自己是个 CEO,SOLO 仿佛是我的 AI 员工。

只不过,加了 Mic Air 这个神级翻译,AI 员工 SOLO 也更好的理解需求,做好交付了。

这是没经过处理的结果:

打开网易新闻 查看精彩图片

这是 Mic Air 经过 AI 处理后的结果,言简意赅,没有半句废话,可以说是个非常精准的指令了。

打开网易新闻 查看精彩图片

你会发现它能够进行「语义理解与自动修正」,主动识别我的语音,并自我修正("不是…是…"),自动保留最终结论,删除被推翻的信息。

不一会儿,SOLO 就帮我生成好了文章:

但说实话,没有配图的文章,显得确实有点太过于技术和枯燥了叭。

于是继续打开语音模式,让它改。

说句实在的,要是把这个语音直接发给 SOLO,占用无效的输入 token 不说,完全是非结构化的指令。

打开网易新闻 查看精彩图片

使用 Mic Air 语音输入,在 SOLO 中能自动将这些转为结构化的文字。

打开网易新闻 查看精彩图片

这点还是非常重要的,特别是在写代码的时候,经常会有多处需要修改,有结构化表达能很好的让 AI 理解需求,减少误解。

然后你就可以看到 SOLO 自己去生成文章配图,帮我把这篇文章算是彻底写好了。

然后我继续在 SOLO 中口喷,让它帮我把我当前文件夹进行分类整理。

说话的口语化还是比较多,不过没关系,SOLO 这边都直接做好了转换,并把文件分类好了。

除了办公类任务,SOLO 还可以进行 Code,这也是它的老本行了。

今天就来体验下,用嘴编程。

我直接让 SOLO 来迭代我最新的开源项目 gpt-image-2.

视频你也看到了,一开始我哔哩啪啦说了一堆需求:

打开网易新闻 查看精彩图片

你看,它自动帮我总结出了就一句话:

打开网易新闻 查看精彩图片

这里还有个细节,「通过自然语音表达,SOLO 语音可以模糊匹配产品功能,一句话完成多步操作」

比如,我让它帮我提交到 GitHub 的时候,他能直接唤起 GitHub CLI 这个技能:

打开网易新闻 查看精彩图片

我试了下,它也能支持 /plan、/skill 等,可用自然语言触发(比如"用 plan 模式")

我发现,当我飙了一句英文,它还能自动识别中英混合。

性能方面,一下子口喷个好几分钟都没啥问题,而且不会中断。

因为 SOLO 实际上是有 web 端的,配合这个语音输入,真的可以做到一边散步一边写代码了。

说真的,体验完这一圈下来,让我兴奋的倒不是「语音写代码多牛」,是一种交互方式正在发生变化。

我们从命令行敲代码,到 IDE 写代码,到 Copilot 补代码,再到现在用嘴说代码。

每一次变化,本质上都是在缩短「你脑子里想的东西」到「它变成现实」之间的距离。

以前你得先想清楚,再组织语言,再打字,再检查。现在你只需要像跟同事吹水一样说出来,AI 负责把你的废话变成精准指令。

我觉得 Voice working 真正的价值在于,它降低了表达的门槛。

你不需要措辞完美,不需要打字快,甚至说错了改口都没关系,AI 帮你兜底。

而且我大胆预测下,Voice working 会是接下来一两年最值得关注的趋势之一。

写代码只是开始,往后写文档、做调研、整理文件、安排日程,所有跟 AI 协作的场景都会被语音重构一遍。

谁先在用户心里把「用嘴干活」这件事的心智抢下来,谁就拿到了下一个时代的入场券。

而 TRAE SOLO + Mic Air 这套组合,已经率先踩在这条线上了。

也许再过几年回头看,我们会觉得「用手敲键盘写代码」这件事,就像现在回头看「用纸带打孔编程」一样古老。

谁知道呢。

对了,这次给大家争取到了一些 SOLO 的邀请码,有兴趣体验的可以在后台发送私信:trae牛逼

我的 TRAE 朋友悄悄告诉我说,他们马上还要放个大招:

上线实时问答互动 Real-time AI Interaction

就是能和 AI 语音讨论,实时转录,就像GPT实时语音一样。

我还是非常期待的。

如果你已经在用 TRAE SOLO 了,也欢迎评论区聊聊你的体验,特别想知道,你们会习惯用嘴写代码吗?