不做玩具！讯飞AI眼镜要做你眼前的超级助理|手机|智能眼镜|电脑|翻译|讯飞ai眼镜|语音识别|麦克风

AI眼镜依然是2026年科技圈最拥挤的赛道之一。硬件巨头、AI大厂、创业公司、传统眼镜品牌、光学供应链都加入了「百镜大战」，OpenAI和苹果的产品在路上，在刚刚结束的I/O大会上，智能眼镜缔造者Google「返场」推出AI眼镜新品给市场再添热度。雷科技在报道澳门BeyondExpo科技创新博览会时发现AI眼镜仍四处可见，甚至出现了专攻老年群体的“银龄AI眼镜”。

AI眼镜爆发了，但用户爱买不爱用

市场前景很美好：Omdia数据显示，2025年全球AI眼镜出货量同比增长322%，达870万台。洛图科技预测2026年中国AI眼镜市场整体销量将突破320万支，年增率高达120%。2026年AI眼镜首次被纳入“国补”范畴，将进一步刺激销量。

百花齐放却挡不住一个灵魂拷问：眼镜卖出去了，用户戴了吗？答案并不乐观。XR Vision监测发现，主流电商平台AI眼镜平均退货率高达30%，许多产品在用户体验尝鲜后被长期冷落在抽屉。

在电商和社媒上，用户的抱怨主要集中在：戴久了不舒服、能用的功能不多、为什么不用手机？说到底，AI眼镜并没有实现从“能用”到“好用”的跨越，距离成为跟手机一样普及的终端还远。

行业其实够努力了：卷重量，卷显示，卷价格，卷颜值……但一直未能回答好一个根本问题：用户戴着它到底能干什么？如果不是近视/远视，用户为什么要戴一副眼镜？讯飞刚刚发布的首款AI眼镜给出了新的解法：让AI眼镜进入用户的工作流，成为“眼前的超级AI助理”。

首款原生Agent眼镜，嵌入真实工作流

讯飞AI眼镜外形与市面上的产品别无二致，但减重取得了突破：只有40g，较同类产品轻约20%。为什么强调同类呢？市面上的AI眼镜有许多类，有的只有拍摄，有的只有音频，AI功能没有或者孱弱。形态最成熟的则是带显示的AI眼镜，讯飞AI眼镜带双目单色显示，搭载摄像头、多麦克风，还拥有GlassClaw（Agent）能力。在这类产品中，讯飞AI眼镜是最轻的。

“轻”是AI眼镜普及的前提。手机功能足够强大，用户还需要AI眼镜是因为它拥有第一视角，无感、自然、随时随地能用，但这一切的前提都是佩戴舒适。市面上许多产品笨重、压耳压鼻梁，厂商赠送鼻托能稍微改善，但用户依然“戴不住”。讯飞AI眼镜在材质和结构上做了极致的工程优化：航空级镁合金框架、一体成型工艺、全贴合树脂波导镜片，40g重量确保用户“戴得住”。同时它在设计上有所取舍，放弃炫酷AR效果，做好双目单色显示，这与其功能定位有关。

（图源：Beyond EXPO）

许多AI眼镜逻辑将手机App“移植”过去，地图导航、视觉搜索等富媒体信息对显示有高要求。讯飞AI眼镜聚焦在交流、演讲、办公等生产力场景，只需展示关键文字信息。

比如用户使用讯飞AI眼镜的杀手锏功能——语音实时翻译时，只需看翻译字幕就可以了，扬声器会同步播放译文，全程无需手机或第三方设备，眼镜自主完成语音采集、识别、翻译与投射，支持同声传译、面对面翻译、线上同传与通话翻译四大模式。相较翻译设备，如翻译笔、翻译耳机，AI眼镜不打断交流，可让翻译更贴近真实交流本身。

做好翻译最大的难题不是算法，而是降噪。跨语言交流许多时候“人多嘴杂”，比如展会、聚会、户外，AI很容易被干扰。讯飞AI眼镜用5颗气导麦克风加1颗骨传导麦克风，同时引入唇动识别多模态降噪，前置摄像头能在复杂环境里，辅助AI判断要采集哪些声音，“该听谁的”。当然这背后有很复杂的逻辑，比如要结合口型信息、声源方位、音量大小甚至声纹识别，不是单一的算法优化，而是软硬件协同的底层能力。

（图源：雷科技）

翻译功能足够强，但讯飞AI眼镜又不是一款翻译眼镜，它的定位是超级办公助理，内置Agent GlassClaw（雷科技将其翻译成“眼镜虾”），底层接入星火大模型，支持多模态理解、任务拆解和跨服务调用。

（图源：雷科技）

在发布会现场，演讲者戴着讯飞AI眼镜全程看提词，眼镜内的字幕配合说话语速同步滚动，充电胶囊同时也是提词遥控器。演讲结束后，GlassClaw记得演讲者分享的所有内容并可进行智能总结。然后演讲者让GlassClaw结合讯飞和BeyondExpo主办方的合作，思考未来的合作方案，给出合作提案并发邮件给主办方、抄送同事，结果它真做到了，全程无手机、电脑辅助，从信息输入到任务执行都在眼镜端闭环。

GlassClaw是讯飞AI眼镜的灵魂，这让它跟“能跑App”的AI眼镜成了不同物种。市面上很多AI眼镜将微信、地图、淘宝投到镜片上，要求用户用滑动、点击、眼动去操作，本质是将手机屏移到眼前，体验很差，也没必要。如果只是迁移手机的内容，用户为什么不用屏幕更大、操作轻松的手机？甚至还有AI眼镜妄图取代智能手机，有些一厢情愿了。

AI眼镜以及大部分AI硬件天生适合“一句话交互”，只是过去受限于AI算法技术，机器很难理解用户的复杂指令，更没法干活儿。今年事情发生了变化：春节过后OpenClaw、Hermes相继出圈爆红，大厂新模型都将Agent能力当核心演进方向，说明用户对AI的需求从来不只是聊天或问答，而是希望它能「干活」，干很多活儿。同时，AI进化得足够快，Agent已能自己理解意图、拆解任务、调用服务、交付结果，执行复杂的“长任务”了。所以2026年被称为Agent普及元年。

讯飞的判断与行业大方向是一致的：AI终极形态不是下一个搜索或者ChatBot，而是Agent，而AI眼镜，恰恰是Agent最理想的物理载体之一，因为它无感自然，随时随地，拥有第一人称视角的摄像头和麦克风，能看到你看到的、听到你听到的。

所以讯飞推出的首款AI眼镜上来就强调Agent能力，以终为始进行产品定义，围绕跨语种沟通和商务、会议等办公场景，把看、听、说、理解、记录、执行串成闭环，成为第一款原生Agent眼镜，让用户可一句话给AI交办任务，真“解放双手”。

（图源：雷科技）

当用户戴上讯飞AI眼镜后，在展会与外国人交流时，不再需要频繁低头看手机翻译提示破坏交流氛围；在会议沟通时，无需额外带录音笔，无需低头操作备忘录App，就能实时进行会议记录与纪要整理；在公众演讲时，不需要背稿，更可避免“对着大提词器演讲却被观众看到读稿”的尴尬……第一视角的AI眼镜，让交流、工作变得更轻松，更自然、从容。

所以看到这里，你就不会对讯飞AI眼镜的定价感到诧异了。4299元的起步价（标准款）在AI眼镜行业不算便宜。即便刨除一些只有音频、没有AI的所谓“千元镜”，讯飞AI眼镜在带显示AI眼镜中都不是最低价的那一档。但如果考虑到它是一款专业级翻译AI眼镜、更是一款“戴在眼前的Agent”的新一代AI眼镜，这个价格又显得过于克制，毕竟这是“买眼镜送Token”的模式，而Token越来越贵，讯飞等于把未来的AI服务价值提前打包进了眼镜里。

一出道就定义新标准，讯飞底气何在？

首款原生Agent眼镜，让讯飞AI眼镜的起点很高。

在发布会开始时，讯飞就提出要“定义一个新标准”，当时雷科技看了Keynote还觉得讯飞挺“狂”的。经历了残酷的百镜大战依然还在牌桌上的玩家，都有几把刷子：除了做硬件、光学、AR的专业户外，还有Meta、阿里、Google这样的超级巨头在列。讯飞凭什么一上来就定义新标准？

（图源：雷科技）

思考行业来时路才发现，讯飞的说法经得起推敲：十多年前做的Google Glass时概念超前，但更像一个能在眼前显示通知的手机配件，没有AI、更无Agent逻辑，它以及当时跟着做的百度Eye们都销声匿迹了；现在市面上大部分AI眼镜能脱离手机，但还是在延续App生态，基于GUI的交互逻辑。但AI时代的中心不再是App而是Agent，交互核心从GUI升级到CLI，只要算法足够成熟、算力足够强大，AI眼镜完全不需要再遵循App逻辑，只需要一句话完成任务和进行必要显示即可。

这就是讯飞AI眼镜的理念，直接做原生Agent眼镜，让AI眼镜成为用户的第二大脑，以眼镜的形态与用户共同感知、共同理解、共同决策，所以说是新一代标准并不夸张。而且多说一句，类似的叙事正在更多品类上演，比如地平线推出的新一代车机Agent系统KaKaClaw（咖咖虾）同样摒弃了GUI，而是让用户以语音为核心与车机交互。

（图源：雷科技）

做原生Agent眼镜，并不意味着要排斥App。在未来GUI软件依然会存在，特别是在手机/PC这样的传统产品形态上，其在信息可见性（设计、游戏、阅读等）、调度（看状态、节点、结果）上依然有显著优势。讯飞AI眼镜可与手机上的讯飞翻译App搭配使用，用户可在App上看到更详细的信息、进行更复杂的操作，Agent硬件与AIPC、手机等设备联动也是行业的普遍做法。

问题是为什么是讯飞先做成了Agent眼镜？理论上来说，音频眼镜、拍照眼镜是更安全的形态，后面下场的大厂只需要将某些维度做得好一点，将价格压得低一点，再凭借生态等系统优势就有机会赢。但讯飞没有这样做，它绕开了显示、性能、续航这些单一维度，不卷硬件参数，大概是因为硬件性能最终会被底层计算平台或者上游光学方案统一解决，比如高通发布新一代穿戴芯片之后，所有厂商的性能都会集体升一级，硬件差异会被迅速拉平。

更重要的是，真正决定胜负的不是硬件，而是眼镜上的AI能做什么，这恰恰是讯飞能回答好的。

讯飞是做语音AI出身的，翻译是应用最广泛且最先赚到钱的场景之一。所以讯飞AI眼镜的“杀手锏”是翻译，这也是被AI眼镜验证过的高频刚需场景，但市面上的产品还有痛点，而讯飞恰好能解决。

讯飞翻译机服务超100万用户、累计翻译次数破10亿；多语言会议系统入驻500万间会议室，服务诸多重要会议；同传系统覆盖50个国家、支持42万场国际会议。这次讯飞成为澳门BeyondEXPO的核心伙伴，与其深耕多语言交流场景有直接关系，在IFA等国际展会以及国际会议，讯飞的存在感一直很强。这一切的背后是翻译算法模型的长期迭代、多语种语音数据的持续积累，以及在各种极端声学环境下的工程化经验，现在，讯飞将这些压到一副40克的AI眼镜里。

而独创的唇动识别降噪方案、率先搭载Agent能力则表明，讯飞的AI技术底子远不止翻译，还有语音AI、多模态理解、基础大模型、智能体能力。讯飞是被低估的AI玩家，它并非大模型浪潮的“后来者”，早在2017年就承建了认知智能全国重点实验室，并将20%左右的营收投入研发，打造了稳居第一梯队的星火大模型和AI开发者生态，在教育/医疗等专业场景积累了丰富的AI落地经验。

讯飞最突出的AI能力是语音，而语音恰好成了今年AI玩家们最重要的事情。在一切都可Vibe的今天，所有AI都在强调语音输入能力，ChatGPT、Claude、Grok、千问、豆包等均在强化电脑端语音输入，甚至推出了Vibe定制麦克风，深层原因是用户与Agent的交互方式正在从“打字”退回到“说话”，语音最符合人类本能的表达方式，比打字快，比用手操作任何设备去输入信息都更自然，更接近人类的沟通本能，因此成了人与AI交互的主界面。

讯飞是做语音AI起家的，从声学前端信号降噪处理，到语音识别、声纹识别、情绪识别、语音合成，再到大模型语义理解和多模态交互，它是少数能做到语音AI全链路自研的中国公司。而AI眼镜恰好是最适合语音交互的Agent硬件之一：触控、眼动等不方便，输入文字更不现实，与此同时它距离“嘴”足够近，搭载骨传导麦克风天然适合“听指令”。

（图源：雷科技）

所以不是讯飞要跟风下场做AI眼镜，而是当AI眼镜的竞争焦点从“能不能用”转向“能不能常戴、能不能听懂、能不能办事”时，游戏自然移到了讯飞的主场。在跨语言办公领域，讯飞深耕多年，面向用户的真实场景，开辟了教育硬件、翻译硬件、办公硬件等产品线，单单是翻译线就打造了AI翻译耳机、讯飞翻译机、讯飞同传麦克风、讯飞会议一体机等成功产品，这样看，讯飞推出AI眼镜是产品演进的结果，多少有点水到渠成的意思。

Google Glass未能普及的原因是太超前，市面上AI眼镜“卖得好、用得少”则是因为沿着“戴在眼前的手机”方向走，在Agent爆发元年，讯飞AI眼镜瞄准Agent眼镜做，恰好是AI能力足够支撑“做事”的节点。它的起点很务实，先把翻译做深，同时也在借助GlassClaw把听到、看到的信息继续变成可执行结果。眼镜负责采集现实世界的信息，AI负责理解和处理，最后再把结果交付出去。这个闭环跑通之后，用户戴上它跨语言交流、会议沟通、信息理解、纪要整理、任务执行变得更轻松，AI眼镜也将从一个新奇硬件，变成人人必备的生产力工具，一个戴在眼前的Agent。