2025年,很多车企都在提AI,各种营销名词都和AI“沾亲带故”。但是当我真正使用了很多AI服务和硬件,发现大多数车企其实并不太懂“AI”,对AI的想象还停留在宣传语或者功能智能层面。
那么,什么是与普通人有关的AI?我先聊聊自己的体验。
01
为AI服务付费的时代
或许很多读者朋友已经在2025年频繁使用过多款AI,无论是DeepSeek、Kimi,还是豆包等免费大模型。不过,这些通用大模型的交互模式都被称为“Chatbot”——聊天机器人,它们在很多人眼中更像一个“新时代的百度”,感觉AI似乎也没那么神奇。
但真实情况是,在一个细分领域,一个优秀的AI服务,是很容易让一个用户为它付费的,而且会毫不犹豫。
这里还可以举一个类似的例子。
多年前,罗永浩曾提出“闪念胶囊”的概念,相当于按一个快捷键就可以记录想法,但这个功能始终不温不火,即便后来iPhone15以及很多安卓手机也设计了一个快捷键用来录音,但使用率一直不高。直到去年,我发现了一个小小的软件——flomo,突然发现我用它录音记录想法、甚至用语音写初稿的频次变高了。
这个flomo软件功能很简单,就是你点开它后就可以开始把你的想法说出来,它在录音后自动上传到云端,利用AI将录音整理好,剔除“嗯啊哦”这些多余语气词,识别率非常高。这款软件的年费是99元,对一款iOSAPP来说并不便宜,但我在体验了几天之后、免费期都没结束,我就毫不犹豫的下单了。
实际上,现在微信和豆包都推出了自己的输入法,而这些输入法都有一个特别简单但是足够厉害的功能——语音大模型的输入识别。比如,你用微信的时候可以发现输入框有一个绿色麦克风按键,点击之后就可以用语音输入,你会发现微信输入法用语音AI大模型能很快帮你将语音转化为文字,去掉一些语气词,甚至还能分段,输入效率变得更高。
另一个例子是,最近我用飞书多维表格搭建了一个公司内部的运营管理表格,这里面就会遇到一些统计公式需要处理。在以往可能只有精通EXCEL的人才能设计那种复杂的透视表格,而现在飞书内置的AI可以直接生成公式,即便是你完全不懂,但也可以很方便的调整。
上面这些就是我实际使用AI的感受。这里面其实都没有提到大家常用的通用大模型,因为我发现真正能够促使用户付费的AI产品,大多是垂直领域的专属功能,而国内可以用到的通用大模型,或许因为市场非常“卷”,免费版本已足够好用。
可是最近我发现,真正能够提升效率、让AI带来进一步能力提升的,往往是那些能与AI联动的AI硬件。
我新入手了一个小设备——飞书AI录音豆。这个设备很有意思,它没有什么特别重要的功能,就是在开会可以时一键录音,会后自动生成会议纪要与要点总结。
当然,这款设备单独买要899元,同时仅附赠半年的飞书妙记的会员权益(每个月限生成25篇纪要)。半年后,则需要单独订阅飞书高级会员,699元一年,每个月可以记录3000分钟和生成50篇AI总结纪要。
这是一种典型的AI硬件模式,硬件付一次钱,AI服务需要单独付费。
而飞书AI录音豆的原型设备,其实是一款名为Plaud的录音卡片,这个设备售价大概是1000元左右,现在出货量已经达到了百万台,也是海外卖得最火一款AI硬件。而且它的收入不仅仅是卖硬件,还在于之后的AI服务,因此目前这家公司的估值也相当高。
或许有人觉得一年服务费699元太贵了,但对于我个人来说感觉还是很划算,比如在新车上市发布会或者采访中,我可以第一时间拿到文字、发出内容,而在第一时间发布的流量价值就可以值回这套AI设备的硬件和服务费用。
这种AI录音设备的核心价值就在于节省了你处理录音的时间成本、让你能专注于更重要的任务。所以不能仅仅把“录音设备”当做一个硬件来看,而是一种“服务”,类似自动驾驶之于特斯拉,对于使用者来说能够实现时间的节约和效率的提升。
比如AI录音能把两个小时的会谈浓缩成几千字的速记,并以表格等形式呈现重点,你可以快速获取重点信息。而且如果以后有什么问题需要查询,你甚至可以在飞书中调用AI直接查询和给出建议,这种高效率是之前只能录音、没有AI总结的时代难以想象的。
而特斯拉FSD则是节约(利用)了你的通勤时间,让你可以在法规允许的前提下边开车边做点其他事情,而不需要专注于道路,这也是AI硬件提升效率的表现。
如果说特斯拉FSD定义了“汽车AI硬件”的范式,那么生活中,似乎还没有出现类似的AI硬件。但这并不妨碍AI硬件被视为下一个“风口”。很多业内人士认为,AI硬件将有机会成为下一个“iPhone”,因此在目前的创业圈,AI设备也是很火的一个赛道。
或许在2026年,我们就能看到一款类似于iPhone的通用AI硬件亮相,让我们从移动互联网时代真正迈入“AI时代”。
02
APP时代退潮,超级AI界面登场
展望2026年的AI硬件需求,我个人对通用AI硬件设备进行了一些思考。而我第一个意识到的问题是,作为现在最大AI硬件风口的AI眼镜,或许并不是一个特别好的入口。
我个人的感觉是,你不可能完全把所有隐私性的交流,比如打字或者语音对话,通过AI眼镜来辅助阐述,因为“听”的效率远远低于“看”的效率。
这就好像微信最早是以语音对话为主打的,但支持文字输入后,大家更多还是用微信进行文字交流。核心原因在于,人类对视觉的记忆留存效率要远远高于听觉,且文字在隐私保护和交互精确性上更具优势。
正如李楠kkk所说,AI硬件设备需要多模态呈现,但多模态的输入或呈现本质上还是不能脱离直接用眼睛看这一方式。因而,所有AI设备都想要解决的一个重要问题其实就是“如何显示”。比如很多AI眼镜的产品团队总是希望给自己加一个显示屏,可是给眼镜增加屏幕带来的问题是更高的耗电量、更重的头戴重量,本质上就背离了便携的初衷。
这就使得眼镜形态本身就不太符合通用AI硬件的原型需求。同时,大部分不带显示屏幕的设备肯定也不会是通用AI硬件。换一个角度来说,无显示屏的AI硬件大概率仅是手机的附属,配合手机使用,通过手机调用AI完成功能。
按照这一逻辑预测,手机至少在十年内仍是不可替代的AI交互核心。但是正如当年从功能机进化到智能手机一样,虽然都叫“手机”,但呈现形态、交互体验发生了巨大的变化。
我个人认为,以手机为载体的AI设备将会出现一个很重要的变化点——即超级APP和超级AI界面的逻辑演进。
按照这个逻辑,我们可以把手机上的APP应用分成两块。一块是需要用户自己操作的,是在APP本身的交互界面里进行,比如微信、QQ、支付宝这类高度社会关系化的应用。另一块,比如像看视频、看抖音或进行其他信息的浏览获取,本质上不再需要单独APP应用,而是可以通过浏览器或者AI应用作为入口输出,根据我们发出的响应来满足自身需求。比如你要设定一个日程管理或者文稿编辑,就不再需要打开日程APP或者Word,而是直接在超级AI里面完成。
在这种需求下,我们会发现手机依然存在,但作为AI需求的入口,其交互不再以特定的APP为主,而是以更独立的浏览器、或者超级AI应用形式实现交互,这非常有意思。
▲来自AI
我听Manus谈及他们的创业逻辑时,他们是把浏览器作为重要的创业思考点,认为浏览器可以创造新的AI智能体。实际上现实中我们使用AI时也能够发现,可以将浏览器视作AI智能体的一个载体,我们和AI的交互都是以浏览器为界面实现的。
比如未来我们浏览新闻时,或许不再需要微博或者抖音,超级AI可以实时根据你的需求推送当下的热点,直接在AI界面输出实时性或者你需求的资讯信息,从而替代大量现在使用的资讯类APP。如果你要看视频,理论上你也可以在AI应用端直接按需搜索,又或者你提出一个方向,直接推送给你——甚至还能防沉迷。
最终,我们的手机上可能只会存留两类APP:一类是超级AI入口,另一类是社交软件。而按照中国移动互联网的发展逻辑,大概率会是一个超级AI绑定一款社交软件。比如,微信和某个超级AI绑定,用户通过这个超级AI调用微信的能力;飞书和豆包AI大模型绑定,同时调用办公和娱乐;支付宝和通义绑定,背靠淘宝满足消费端的需求。
03
端侧AI,或许没那么重要
这里还引申一个另问题:我们的手机是否需具备运行端侧AI大模型的能力?
我个人感觉,端侧大模型对于目前的AI功能来说并不是强需求,即便是端侧跑7B左右的模型,能解决的问题也有限。一个类比是,如今手机的SOC性能都是过剩的,基本上需求端的应用是以实时互联为主,一旦手机断网,离线状态下能做的事非常少,无非是听音乐、看看电子书等,如果要使用移动互联网的所有应用,基本都必须联网。
所以从互联网思维出发,会发现手机上可能不需要真正的端侧AI,而更需要实时互联,即便云端有延迟也影响不大。因为功能都是和移动网络强绑定,只要有网络,云端AI模型的效率和效果都要比端侧能力更强。
而端侧大模型的核心任务,可能只剩两项:一是实时的语音转译文字,节省上传云端识别这一环节,提升效率;另一个则是用思维链来分解任务,从而更快地获取云端解决方案。
但其实从本质上说,端侧大模型是否需要分解任务也非关键,更重要的是实时联网。就好像在3G时代,智能手机上的APP几乎都有所谓的“预缓存”功能,但真正到了5G时代,这个功能就不重要了。那么在预测下一代移动通信能力时,现在云端AI的问题在于无法解决实时性回馈,如果按照6G、7G的逻辑理解,AI的反馈足够实时,那是否有端侧AI其实真的就不重要了。
▲来自AI
端侧AI最重要的任务,可能是进行语音识别、界面复现,呈现从云端下来的代码的能力。所以,对于端侧到底要跑多大的模型,个人认为不是核心。当然我个人不太懂程序代码这部分,只是从用户体验来说,整个端侧AI的需求只是在手机上帮我们把AI输出的内容对齐。
总而言之,AI硬件已经箭在弦上,至少未来十年依然是手机形态,但我们并不需要能够在手机上跑得飞快的超级算力终端,而或许只需要一部上网速度更快的机器就够了。
封面来自AI
热门跟贴