来源:市场资讯

(来源:非凡产研)

环球非凡大赏

这群在大湾区做AI硬件的人,发现手机根本不是对手

AI Agent 明明被视为下一个时代的灵魂,为什么一旦装进硬件的“躯壳”里,就变得水土不服?

在2026年,把 AI 硬件做好的前提,恰恰是“后退一步”。

全球有超过十几亿人每天戴着近视眼镜。但是硬件狂人们把AI 大模型塞进镜框后,一个极其尴尬的真相出现了:

用户根本戴不住它。

为了加一个摄像头、一块能看清微信的屏幕,AI 眼镜的重量轻易突破了 40 克,开机一小时就电量告急。结果是,这个耗资几十亿训练出来的“最强大脑”,在现实中沦落成了偶尔拍个照的“高级玩具”。

AI Agent(智能体)明明被视为下一个时代的灵魂,为什么一旦装进硬件的“躯壳”里,就变得水土不服?

在最近的“香港·环球非凡大赏”趋势圆桌上,四位深耕AI硬件、XR、康养及语音交互的顶尖创业者,进行了一场名为“壳中之灵”的激辩。他们揭开了一个反常识的商业逻辑:在2026年,把 AI 硬件做好的前提,恰恰是“后退一步”。

为了让 AI 消失,他们造了 1 克的屏幕

一直以来,AI硬件绕不开一个“不可能三角”:功能多、续航久、重量轻。

你要屏幕亮,电池就得大,眼镜就会重得压断鼻梁;你要它轻如鸿毛,那它就只剩下一个麦克风。

“终极的 AI 硬件,应该是让人感到无感。”GYGES LABS 大中华区总经理蒋大伟在这个问题上,选择了一个极其极端的解法。

这是一家由斯坦福博士组成的团队,他们没有去死磕极其耗电的传统光波导镜片,而是“手搓”了一个全球最小的显示系统 DigiWindow——重量不到 1 克。把它塞进不到 30 克的眼镜里,功耗不到 30 毫瓦,续航能撑 3 到 4 天。

这是一个极具启发性的退让:它不再试图给你一个绚丽的虚拟世界,而是只在你需要的时候,提示那 100 条最重要的信息。 比如,商务谈判时,AI 主动听到“香港人口”,然后默默在眼镜边缘投射出答案:香港人口有750万。

当你不用它时,它就像是一副普通的、配着 400 度近视镜片的框架眼镜。这正是硬件的狡黠之处:不改变用户习惯,只是偷偷加了一点魔法。

“不要试图取代手机,去做手机的小弟”

很多人质疑:既然手机的算力那么强,能录音、能翻译,我们为什么还要额外花几千块买一个独立的 AI 录音笔?

Wavenote 创始人华琨给出了一个异常清醒的定位:“因为手机是大哥,大哥太忙了。”

手机要接电话、刷视频、回微信,它无法胜任长达两小时的深度录音或高频外语翻译。一个电话打进来,录音可能就断了。

这就是为什么传统的录音笔每年依然有几千万的销量,而加上了 AI 大模型后,这个盘子更是迎来了千万级的爆发。在全球上亿的重度办公人群眼中,他们需要的不是一个能做所有事的设备,而是一个“录得远、不用等转写、绝对可靠”的偏执狂工具。

同样的情感,也出现在康养赛道。东方启明 CCO 李淑婷带来了一款“AI 戒指”。它不仅监测心率,背后还跑着 320 亿参数的东方文化大模型。

试想一下,当你刚结束跨国飞行落地,一枚戒指温和地提醒你:“今日舟车劳顿,宜静坐三分钟。”

这种情绪的慰藉和降噪的时刻,是手机冰冷的 Push 通知永远无法替代的。硬件,正在成为提供情绪价值的灵魂容器。

被忽视的颠覆者:当硬件学会“主动偷听”

如果说眼镜和录音笔是效率工具,那么 AI 到底给一直不温不火的 XR(扩展现实)行业带来了什么?

“以前的 AR 和 VR,只能给你提供视觉上的‘显示’。但 AI 带来的,是与真实世界的‘交互’。”在XR行业摸爬滚打了 11 年的追焦科技创始人案山子,指出了一个核心的转折点。

过去的硬件是被动的——你按一下按钮,它给你一个反应。

现在的 AI 眼镜是主动的。案山子提到了一款在海外卖爆的 Even Reality(逸文科技)眼镜。为了把重量拉到极致的 38 克,它直接砍掉了外放喇叭和摄像头,只保留了麦克风

它凭什么好卖?因为它进入了一种“Always On(永远在线)”的状态。它长时间听你在做什么,在交流时主动抓取关键词,用显示的形式把信息喂给你。硬件从“等待指令的机器”,变成了“理解世界的第一视角 Agent”。

这种务实的设计在出海市场正在大杀四方。相比于动辄上万人民币、重达两三百克、今年市场相对遇冷的 MR 头显(如 Vision Pro),海外消费者极其乐意为 600-800 美金的轻量化 AI 眼镜买单。

把佩戴舒适度拉满,把一个特定场景打透,才是出海的财富密码。

如果从头再来,他们会 All in 哪张牌?

未来的智能体硬件会是什么样?

是华琨眼中能够听懂“呢喃细语”、释放双手解决隐私问题的极简语音入口;是李淑婷手里那枚能够全天候陪伴、给养老机构降本增效的 AI 戒指;是蒋大伟团队那个可以挂在帽子上、甚至医生手术刀上的 1 克显示器。

又或者是案山子所期待的、结合了李飞飞“世界模型”的 XR 头显——你只要用自然语言开口,就能像造物主一样生成一个真实的空间。

无论形态如何千变万化,大湾区的硬件创业者们已经达成了一个共识:2026年,硬件不再是信息的载体,而是你在这个物理世界的“数字替身”。

不缺壳的时代,谁能先把那个最懂用户的“灵”装进去,谁就能拿到下一个万亿市场的船票。

更多对话细节

香港·环球非凡大赏 趋势圆桌 Panel主题: 壳中之灵:装进设备里的Agent与AI硬件的全新商机

嘉宾: 东方启明 CCO首席客户官 -李淑婷、Wavenote 创始人&CEO- 华琨、GYGES LABS 大中华区业务总经理- 蒋大伟、追焦科技 创始人- 案山子

主持人:世界经理人 科技视野主理人 - 康正中

打开网易新闻 查看精彩图片

康正中:我是环球资源的,我们旗下有个商业管理媒体叫《世界经理人》,《科技视野》的栏目也是我在负责。我们这场 panel 叫“壳中之灵”,其实刚刚讨论了很多关于 AI 的软件,包括一些应用的东西,但是在我们大湾区这个地方应该是离不开硬件的,对不对?所以其实这个话题应该是从两个角度,第一个是讨论一下“壳”跟“灵”,壳就是我们的硬件,灵呢当然是现在常讲的 Agent。过去的几个月,其实大家讨论最多的一个是Physical.ai ,一个是所谓的 OpenClaw。大家都讲,哇,AI Agent 好厉害,机器人要来了,但是两者之间结合会得出出一个什么样的结论,其实很多时候我们也在探讨吧。所以在进入这个话题之前,我们请到了四位在这个行业的一些顶尖的创业者,我们先请他们用一分钟左右的时间介绍一下自己跟公司背后的业务,蒋总先开始好不好。

蒋大伟:我叫蒋大伟,来自于 GYGES LABS。我们公司 GYGES 的这个取名,我可以给大家讲个故事,就是来自于希腊的一个传说。柏拉图写了一本书叫《理想国》,《理想国》里面一个牧羊人,那个牧羊人在一个洞穴里面找到了一枚戒指,然后拿了个戒指之后,他得到了一个神奇的力量,让自己隐身,最后他做到了这个国家的国王。然后呢,这个牧羊人就取名盖吉斯,我们叫 GYGES 实验室。 然后呢,今天我也带了我们公司的产品,大家也看到了我这个戒指,我这个戒指可以操控我的眼镜。也可以大家简单演示一下,这里面给环球资源打个广告,就是我可以看到一个画面:环球资源是中国历史上最老牌的国际 B2B 跨境电商平台,成立1971年,然后呢原名叫亚洲资源,总部在香港,2000 年纳斯达克上市。

华琨:大家好,我们是 Wavenote,我们其实有三款不同形态的产品,因为其实录音这个赛道还是非常大的。我们是 24 年开始发现大模型和这个的结合,以及这里的潜力,因为确实很多线下的语音信息其实在以前是没有很好地被利用起来。当然好像做这块的也很多,但实际上我觉得做得好的并不多。我觉得这里面其实主要是一个“软件定义硬件”的赛道,其实更多的是软件的带宽,实际上我们本身在做的是一个 Agent。当然硬件本身也要做好,因为用户第一个买的它实际上是个硬件。

康正中:那华总你们现在硬件形态是耳机吗?还是?

华琨:当然我们会根据用户的需求来。比如商务人士他还是比较喜欢这种便携的卡片的形态,但学校的高校的话,他会更喜欢这种佩戴,或者是这种磁吸的方式。

李淑婷:我是东方启明的 CCO李淑婷。我们东方启明是一家“AI+东方文化”的科技企业。我们目前已经收集了近千部古籍经典,类似像《黄帝内经》这一块的一些经典古籍数字化。其实用大白话来讲的话,其实就是把老祖宗几千年的智慧,我们把它 AI 翻译过后,放到了我们的 AI 产品里面。我们现在主推的产品有一些像东方慧戒和东方慧眼,也是我们的 AI 戒指。我们现在的一个核心技术是国家级备案的 320 亿参数的东方文化大模型,其实我们的愿望也是想要让东方智慧装进设备,让大家在日常生活中更多地去接触到东方文化。

案山子:大家好,我是追焦科技的创始人案山子,也是刚刚从我的上一家公司出来,现在属于是自己创业的一个阶段。我在这个行业里面跟踪了大概有 11 年多的时间,所以呢也是相当于跟着整个 XR 产业一路走到现在。那现在我们看到,眼睛的形态其实像 GYGES LABS 这边佩戴的已经是非常轻薄的一个状态了,所以我们可以看到技术有很大的一个进步。怎么说呢,我们是一个产业的观察者,也是资源的衔接者,所以如果大家有需求的话也可以联系我们。

康正中:谢谢案山子老师。那我们回到今天这个 panel 的主题,其实应该是从两个视角解读:“壳与灵”。壳当然指硬件,我刚刚说的灵应该就是我们的 AI Agent。那我们第一个视角,从技术趋势的角度去谈一谈。第一个我想问一下蒋总,谈到 AI 的这种形态,AI 眼镜一定是逃不掉的一个必选项。很多人会认为 AI 眼镜是 AI 硬件最终的一个形态,当然有不同的看法的,比如华总跟李总可能会有不同的角度。但一般对于 AI 眼镜来说,我们通常说是 Agent 的第一视角嘛。所以你们认为 AI 眼镜的终极形态到底是在追求极极致的消失感——比如像案山子老师一样,你要让佩戴者感受到无感,还是说去追求一个更强的这种交互感呢?

蒋大伟:因为这里面用了“终极”嘛,对吧?终极肯定还是让人戴得比较舒服。说老实话,也看到在座很多朋友戴了眼镜,在国内应该有差不多 40% 的人群戴眼镜。全球有 80 亿人口,不说一半吧,接近一半的人可能戴眼镜。那因为我是做眼镜的,我们去年发明了这个眼镜。其实我看那个画面,这个显示器是我们公司的专利,因为创始团队有来自斯坦福的博士,他们在实验室搓出了一个全球最小的显示系统,我们现在一直喊那个口号,全球最小的显示系统 DigiWindow,它的重量不到一克。把这不到一克的显示器放到我的眼镜里面,大家可以想一想,它的重量肯定很轻的。因为它不是显示在我的镜片上,所以我们一起交流不会很尴尬。如果在我的镜片上大家也看得到对吧?我摘起来给大家看一下。这么远的距离大家几乎看不到,但是我看看得到。我的手机在我的包里面,如果打个比方,这时候有一些重要的东西我是看得到的,就是谁在找我。

当然接住刚刚 michael 老师说的这个话题,终极肯定还是让大家感到无感、戴得比较舒适。但是现在大家对 AI 眼镜的交互好像期待很高,比方说苹果的 Vision Pro。我们CTO、其中一个斯坦福毕业的博士,去苹果时就是 Vision Pro 团队之一的。就目前这个交互感,我个人觉得可能大家还有其他的想法,Vision Pro 它的交互感可能更强、可操纵能力比较强。除此以外现在卖得最好的比如 Meta,它不能说交互很强吧,它只是在原有的产品上增加了一个功能,就是拍照功能。我个人理解,比方说加州那些地方光线比较强,本来 Ray-Ban 的用户就很多,他出行就会戴墨镜,那我给你再加一个小小的拍照功能,你愿不愿意买呢?那我肯定愿意买是吧?或者我原来这个墨镜本来就坏了,我加个拍照,出行看到画面我就拍一下,我这种感觉很好。

但是再加更多的功能,比如识物,当然现在识物慢慢也做得比较好了。还有其他的什么付款、给我点杯咖啡、我要骑共享单车,这个口号可以喊,但是目前的交互感可能并不强。体感不强的时候,很多消费者买在手上可能就退货了。这里面我跟大家简单卖个瓜吧,我们和Halliday联合发布的眼镜去年在 Kickstarter 上面是众筹历史上卖得最多的一款 AI 眼镜。我们第一天开售就卖到了将近 2000 台,一天。这都不是我在吹牛,大家可以查得到的,第一天就卖了 100 万美金,整个众筹四十多天卖了接近 400 多万美金。

因为我们在眼镜上只是加了一个很小很小的改变,就是你原来本身就戴眼镜的,michael 也戴眼镜,那我在你眼镜上面加一个显示器,你行不行呢?重量可能只加到一克,当然这个显示器里还要有 PCBA、电池对吧,但它整个眼镜重量还是维持在不到 30 克。我这个眼镜 28.5 克。就是戴着我能撑得住一天。然后因为它的功耗也比较低,就像我们平常用的耳机一样的,功耗不超过 30 毫瓦,所以我撑得住三四天都有电,除非我一直在使用它。所以刚刚说的这个问题,未来终极肯定是无感。每个人戴眼镜都希望舒服一点,如果太重压着鼻梁也不舒服。终极感肯定是无感,但是我们能不能等到那天?我相信能等到。最早的第一台计算机的重量应该是达到 30 吨,到了我们今天笔记本电脑多轻。未来的眼镜能不能到那天,我不知道要多久,但是一定会达到的。

康正中:所以蒋总的大概意思就是说,首先眼镜它的力学原理,它是要让佩戴舒服,再找到一些细分场景去加一些功能,刚刚说的拍照也好、显示技术也好。当然我追加一个问题,AI 眼镜一直有案山子老师文章里报道的“不可能三角”嘛,对不对?你又想它的重量比较让人感觉到舒服,又想增加功能,包括续航这些东西,你们是怎么去做取舍呢?

蒋大伟:因为我们眼镜发展不是很久,这个不可能三角,当然案山子老师很熟,也做了很多的关注。我们在这个不可能三角里面算是做得稍微好一点点。为什么叫不可能三角?就是眼镜大家希望它功能多、续航也久。如果你功能多,比如我加了拍照,我也要显示画面。原来那种光波导的显示画面是在镜片上,原理是通过旁边有一个光机,就像平时开会用的投影仪,光亮度要达到几十万尼特,多次折射后到镜片上你才能看到画面。在室内看可能比较清楚,如果在室外光强度一高,你的亮度就要很高。那这样的话你电池是不是要加大?

康正中:是。

蒋大伟:你不可能一开机一个小时就没电了。电池一加大,眼镜就会变重,你不愿意戴。要功能多,续航又要久,眼镜又会变重,这就是不可能三角。我们这个重量不到 30 克,一般的普通镜框在 20 到 40 克之间是比较舒适的。然后我们的续航大概三到四天,因为功耗很低。这里面还有我们的佩戴方式也比较传统,我这个镜片是 400 度近视,镜片可以拿下来的,不影响后面。然后我上面这镜头是可以调整近视度的,它支持 1000 度以内的近视人群。它是通过拉大那个距离,有点像单反相机和望远镜一样,调整屈光度。所以算是完成了突破这不可能三角的基础,当然我们也希望做得更小更轻。AI 的硬件跟软件再往前发展一步,可能就能找到更好的平衡点。

康正中:第二个我想问一下华总,现在做录音、做翻译的,其实很多大厂商的软件也有。那在 2024 年的这个情况下,针对不同的场景有不同的硬件入口,我们主要的技术壁垒是在哪里?可以分享一下。

华琨:其实是这样,很多朋友会问这个问题说我用手机、用软件为什么不可以?其实确实可以,所以这一批用户他其实不是硬件的主要用户。但是呢,录音设备存在很多年了。我觉得很多 AI 硬件都是在做“手机的小弟”,因为硬件里手机是大哥嘛,每个人都会带着。但是呢,因为这个大哥太忙了,他有很多不擅长或者不愿意去做的事。比如你要录一个两小时的会议,一个电话进来就断掉了。所以其实很多重度用户,在全球范围的话也是一个上亿的人群。光传统的录音笔就有几千万的量,在大模型的价值下,很多人原有的潜在需求也被激发了出来。所以我们可以看到 AI 录音产品目前全球销量其实也还是在百万级别,渗透空间还很大。

说到壁垒,首先硬件本身就是一层壁垒。因为有那么一批重度用户,他使用频次高、使用时间长、对质量要求比较高,他们会选择买专业的 AI 硬件。这个赛道比如相比蒋总做的 AI 眼镜是个更大的赛道,阿里、Meta 都在做;但录音赛道比较小,适合创业公司做。第二,硬件的体验现在还有很多问题。比如续航,我们的产品已经优化得比较好可以用一个礼拜,用户没有电量焦虑;另外录音怎么样能录得更远、最后一排能不能录清楚;传输体验怎么样能做得更好;还有跟大模型的结合。现在很多还在云端处理,ASR 转写用户还需要等待,最理想的情况是用户录完后不需要传输、不需要等待转写,马上可以看。我们也在研究端侧模型,现在端侧能做的事情有限,但在一些短时间录音上,可以做到本地转写跟云端结合,让用户体验最爽。这里面还有很多可以做的事情。

康正中:我的理解就是,第一个我们从来没有想过所谓做翻译的硬件去取代 iPhone,取代手机,对不对?

华琨:没有没有,我们是它的一个补充,满足一部分重度用户在专业场景的使用。

康正中:然后像你说的找到一些细分场景,比如商务人士这种重度用户,其实还是有足够多的市场去支撑这个品类。

华琨:他们其实有很多需求没有得到很好的解决,因为手机它并不擅长或者也没有重点去做这块。

康正中:那第三个想问一下李总。我的理解是你们属于康养的赛道,对吗?因为康养赛道里面,因为特定人群的关系,其实它更注重所谓的功能性。那做康养赛道硬件的时候,你认为赋予硬件更多的是让他去理解特定人群的情绪价值,还是说在硬件形态里面去实现生命这种温度的感觉,哪个更重要?

李淑婷:其实我认为理解用户的情绪是灵魂,但它的硬件只是它的躯壳。如果有了这个灵魂的话,其实它自然而然就会有温度感了,就不单单是一个冰冷的电路板。传统一些康养硬件就是给你真实身体数据反馈,比如说你当下的心率是 90。而在我们的产品里,我们会根据《黄帝内经》结合你当下的身体状态,去给到你一些提示。我举个真实的客户反馈例子:他经常跨国飞行,他说他最感动的时刻,就是带了我们那个戒指,在飞机落地的这一刻,戒指会给他很有温度的提醒:“今日舟车劳顿,宜坐三分钟”。他说那三分钟是他最降噪的时刻。我们想输出的观点是,东方智慧不是教大家怎么去更快,我们想要教会大家的是什么时候该慢下来,让身体处于一个比较好的舒适状态。

康正中:就是特定场景的大模型能力才是你们技术的关键,或者说是核心竞争力。

李淑婷:我们有一些像节气养生的提醒,还有日常的,比如今天下午三点是小肠经当令,适合多饮水或者去休息调整一下。你可以把它当成是一个最懂你的养生老朋友在身边,给到你慰藉和情绪价值。

康正中:就是你们可能有一些特定场景的核心小模型训练的数据,然后硬件只是一个入口,可能是戒指,也可能是其他载体。

李淑婷:任何载体都可以。

康正中:那最后一个关于技术趋势的问题,我想问一下案山子老师。过去一直在 XR 这个行业里,大家感觉 XR 就是一个显示技术。那在今天,Agent 作为灵魂,是怎么把这项显示技术变成一个与物理世界去进行交互的智能空间呢?是怎么帮到硬件企业去做转型的呢?

案山子:主要这样子。不管 AI 眼镜、AR 眼镜还是 MR 头显,核心功能都是给你带来更沉浸的显示效果。那 AI 从 23、24 年开始,对我们领域的推动非常明显,不管从资本层面、产品层面还是市场环境。去年 AI 眼镜销量达到大概 800 多万副,相对于前年翻了三倍多,我们预测今年会达到 1000 多万台。很多时候大家冲着 AI 来买的,但你会发现 AI 在目前产品里产生的价值并不是特别大。

当然有个前提,戴眼镜的用户群很大。全球 70 亿人里有26亿人戴眼镜,中国 14 亿人里有 7 亿人戴眼镜。AI 眼镜价格大概 2000 多到 3000 多不等;海外高端联名款,比如 Google 联合 GUCCI,Meta 联合 Prada 或者 Ray-Ban,价格可能大几千。整体消费能力还是匹配的。

关于 AI 为眼镜/头显带来了什么?AR/VR 给你的是显示,AI 带来的是跟真实世界的交互。分为几个层次:第一是“感知”,通过摄像头、传感器感知真实世界。第二是“理解”,比如 Even Reality (逸文科技) 的眼镜,你可以直接问它我所在什么场景,它基于摄像头和定位识别出来告诉你在环球资源的展会上。第三是“决策”,提供信息给你。我最近体验 Even Reality 的眼镜,为了重量做到了极致轻,它去掉了 Speaker 和摄像头,只有麦克风。它能长时间听你在做什么,交流时它主动抓取关键词信息用显示的形式提供给你。这让 AI 从“人发指令”纯被动变成了主动形态。最后是“执行”和“进化”,AI 会在不断学习的过程中理解你。

我们为什么一直觉得 AI 眼镜是个非常好的载体?因为它基于第一人称视角跟你一样理解这个世界,听到你听到的,看到你看到的。当然隐私问题大家会担心,但为了获得便捷智能的 AI,可能最后会出现一个平衡。 AI 眼镜很好是因为我们一直想做到 Always on 的状态。现在还比较难,因为不可能三角。我们现在解决了从笨重到轻薄的佩戴舒适问题,接下来的就是底层供应链的进步,比如显示效果、电池能量密度、光学的进步。 所以现在眼镜形态百花齐放。有专门针对盲人的、骑行运动的、翻译的,也有像 Meta Ray-Ban 想做空间计算结合眼球追踪和肌电手环的,这种形态可能是未来真正替代手机的产品。

康正中:我们继续下一个商业和全球化的视角。问蒋总,原来在讨论智能手机 iPhone 时刻的时候,除了苹果手机本身的交互能力,还有个很重要的是它的生态。那现在做 AI 眼镜,像 Apple、Meta 都有自己的生态圈。我们在做商业化、全球化的过程中,因为知道你们是新加坡的品牌,有中国亚洲供应链的优势。你们核心卖点是卖一个更便捷的眼镜,还是卖一个特定场景端侧的 Agent 呢?

蒋大伟:我们公司总部在新加坡,硅谷有团队开发主动式 AI。刚刚案山子老师也说了,在沟通中启动 AI,它主动听你聊天。比如听到“香港人口多少”,它会给你个信息提示。除了做硬件,你要基于消费者的使用场景。我们现在的眼镜受众更多的是律师、商务人士、销售人员。比如我见客户,频繁拿手机看消息很不礼貌,打开电脑对面对着他聊天也不可行。有个眼镜是不是可行一点?我们希望把 DigiWindow 这个极小的显示器搭载到更多场景里面,也许是眼镜、帽子、头盔、修手表的放大镜,或者外科医生做手术看数据。它任何产品都是搭载在场景当中。

我们也不会被苹果、Meta 包围,因为我们做的产品不一样。我们想做一天全天佩戴的眼镜,配镜片也方便,不笨重。有个小能力就是让你看到手机信息,为了不错过重要的那 100 条信息,缓解手机震动带来的焦虑。AI 眼镜很火就是能让人更好地脱手去处理其他事情。你步骤超过三步以上,别人就不想用了。

康正中:所以蒋总其实是有解决特定场景的能力,只是硬件入口现在选择了眼镜,对不对?

蒋大伟:我们公司的梦想是“To make everyone superhero”让每个人成为超人。我们希望在穿戴类,比如纽扣、领夹、手环、戒指输出方案。我们不是一个做眼镜的公司,我们是做 AI 穿戴的公司。

康正中:蒋总是一个好的创业者,也是好的 sales。那问下华总,大家提到 AI 离不开隐私。你提到重度用户有一部分是海外商务人士,用硬件有一点好处是数据在端侧。这种海外商务人士对端侧隐私加密付费的意愿,是不是足以支撑翻译录音硬件品类的全球化增长?

华琨:隐私肯定是很多用户关心的问题。但我先讲答案:我认为这个市场会比较小,是一个 Niche 的市场。完全在意隐私的用户是不会信任云端的,要求完全本地化。现在有方案吗?像 Google 发布的 Gemma 4b 模型,在 32G 的 Mac mini 上跑得很好,结合录音设备可以实现完全不需要云端。但问题是成本高、门槛高、牺牲了便携。你会发现其实用户在效率面前,他是能牺牲一定安全性的,从 OpenClaw 案例上就能看出来。这是一个 balance。

特定场景下有特定机构会付费定制私有化解决方案,但这个造价成本都很高。我们更关注“相对的安全”。解决长会议依然靠云端,短时间即时翻译可以用本地。云端我们要做的就是确保存储加密,同时把选择权交给用户。我们做了一个功能,只在云端处理但不保留记忆。因为大模型的价值是记住你是谁,如果隔天就不认识了要重新说,确实很难取舍,所以选择权交给用户自己。

康正中:先解决效率问题再去考虑隐私问题。李总,康养硬件在海外有准入门槛甚至法律责任。以陪伴机器人为例,你认为商业爆发点是在 B 端(养老机构降本增效)还是 C 端家庭?复购逻辑是什么?

李淑婷:我觉得陪伴机器人爆发点一定是在 B 端。B 端现在的痛点最痛,比如养老机构护工的人效非常贵、整体风险大。我们这个场景,比如张奶奶想喝水了,她可以通过平板一键触达护工。因为方言文化差异等场景可能导致老人很多时候容易跟护工产生矛盾,我们能提供一个能理解老人、不被打扰的陪伴。C 端目前还不是被特别刚需的场景,可能更多存在于高消费、高净值人群。复购逻辑主要还是要培养他的一个习惯。沉没成本也很高,所以目前 B 端是比较大的一个爆发点。

康正中:案山子老师,目前 XR 硬件出海策略,你更看好 B 端(企业级培训)还是 C 端(娱乐社交)的增长?

案山子:这需要分两端来看,因为硬件形态完全不一样。如果是 MR 头显(Meta Quest、Pico Neo、苹果 Vision Pro 这种),真正能把量带起来的依然还是 C 端娱乐形态。今年 MR 形态会有大变化,重量会从以前的 400-600 克降到 100-200 多克,计算单元下放,支持 SLAM 空间定位。体验提升但价格下不来,可能依然要 1 万以上,所以今年 MR 相对会比较冷一点。

另外一条线就是轻薄 AI 眼镜。优先佩戴体验,再定义特定场景的工具性产品。比如刚才提到的 Even Reality (逸文科技) 产品,重量做到 38 克,没有摄像头和 Speaker 专做信息提示“抬头显示”。在海外卖 600-800 美金,获得了比较好的市场反馈。把佩戴和设计拉到极致再去叠功能,把一个场景打透,就能获得很好的市场反馈。

康正中:由于时间问题,最后一个开放式问题:假设 2026 年的今天,我们要 All in 一个 AI 硬件产品,你们会选择什么?可以选自己的,蒋总先开始。

蒋大伟:今年肯定还是重点卖这款搭载 DigiWindow 的眼镜。另外我们公开了一款产品叫 VOCCI 戒指,因为很多人不想戴眼镜但想用录音。这个戒指可以录八个小时,我今天就一直开着,可以给重要的话题 highlights 一下,晚上关了它就把全天的拜访给我输出会议纪要。

华琨:我们还是会围绕语音类。我觉得有两个很有意思的,一个是“Always On”的场景能随时总结互动。另外除了一般录音,我们在想怎么做一个极简的语音入口。因为很多场合你并不希望别人听到你在说什么,像 Whisper 那种呢喃细语,希望 AI 听得懂又能释放双手,语音是个非常值得深耕的赛道。

李淑婷:我也会选 AI 戒指。它佩戴无感,可以 24 小时跟人体交互,续航长达一周。而且可以做个性化 DIY 定制,跟 APP 端打通给到个性化桌面。作为女生的视角来讲它首先是个饰品,其次它的功能也很有作用。

案山子:长远性感一点的是脑机,但离消费级太远了。我依然选择 XR。它给人想象空间太大,比如首先解决屈光近视人群的替换。更长远的,它能理解你的现实世界,让你像造物主一样。最近我们把李飞飞的世界模型放到了 VR 头显里,你可以用自然语言生成一个世界,这非常酷。