文 | 孙小雯

访谈 / 编辑 | 海若镜

「暗涌Waves」独家获悉,侵入式脑机接口公司「芯生视界」近日完成近亿元人民币种子轮融资。本轮融资由经纬创投领投,星连资本、燕缘创投、水木创投跟投。

当下,侵入式脑机接口已经在治疗瘫痪、脑控外设等医疗场景落地,验证长期植入的安全、有效。与此同时,AI Agent和具身智能技术加速进化,也放大了市场对脑机接口的期待:改写未来“人机交互”的方式,实现人机融合、增强人类。马斯克和他的Neuralink,正是这一叙事的风向标。

芯生视界团队集合了多位国家“脑计划”脑机接口方向“青年首席”:创始人王茜来自北京大学心理与认知科学学院、IDG麦戈文脑科学研究所。联合创始人李远宁来自上海科技大学,是卡耐基梅隆大学人工智能和神经科学博士,曾在加州大学旧金山分校Edward Chang实验室(脑机接口顶级实验室)从事博后研究多年。联创团队还包括来自北京大学具身智能、脑机芯片和类脑芯片等方向的专家。

这支年轻的科学家团队,出道就获得了一线科技基金、北大及清华系机构的同时注资。他们选择的方向也很明确:视觉、语言和具身融合;目标是做万通道、一体式植入的“神经显卡”脑机接口系统。

芯生视界联合创始人李远宁认为,视觉是人类最重要的感知输入,语言则是人类对外表达的核心输出。在脑机接口研究中,视觉信息如何高效写入人的大脑,意图和语义又该如何被读出。这既对应失明、失语患者的功能重建,也更接近人机交互的核心问题。

为什么第一步选择视觉重建,当下能做到什么程度?脑机接口“神经显卡”究竟意味着什么?视觉、语言和具身智能之间,又如何构成下一代人机交互的桥梁?以下是我们与李远宁的对话(经编辑):

01 科学家下场

暗涌:芯生视界的几位联合创始人是如何走到一起,决定创立公司的?

李远宁:这其实源于一个对技术终局的共同判断:人类与世界交互的本质,一端是“感知”,一端是“表达”。

我和王茜研究人脑视觉、语言皮层时间比较久。十几年前,在CMU攻读博士期间,我便在匹兹堡大学医学中心开展了侵入式的人类视皮层神经编解码研究,发表了多篇关于电刺激产生文字和记忆幻觉的研究。后来我又参与领导了国内最早的侵入式汉语脑机接口研究。

与此同时,王茜老师团队在国内率先实现了基于临床病人的视皮层单神经元记录,并在2020年发表了“人类视皮层电刺激诱发彩色视觉幻觉的映射机制”的研究论文。

当我们将跨越十年的底层算法、试验数据汇聚,想合作将其真正推向临床转化时,发现急需一套能够精密调控、实现信息双向闭环的硬件基座。

为此,我们联合了北京大学主攻脑机硬件芯片的顶尖团队,他们拥有稀缺的工业级流片与规模化量产经验。

芯生视界的另一位联创朱毅鑫教授,同样来自北京大学。作为国内少有的曾受邀在NVIDIA GTC全球大会上作报告的具身智能专家,他也被“人机融合”的愿景所打动而加入。

至此团队最终聚集了从神经机制解析、底层高通量芯片、前沿临床医学,再到具身AI互联的全链条专家,这也是我们从硅基算力到碳硅融合的技术壁垒。

暗涌:现在国内估值百亿的脑机接口公司已有几家,现在入场,会有点晚吗?既往做运动功能重建的公司,所积累的数据和能力,容易泛化到视觉、语言等适应症吗?

李远宁:从公司成立时间来看,我们不算早的。但此前的公司大都是针对运动功能重建,而我们选择的视觉、语言和具身方向,大家都刚刚开始,我们积累可能还更深。

运动功能重建积累的数据飞轮,很难迁移到其他认知功能上。

运动控制的维度相对较低,但视觉和语言涉及极高维度的非线性编码。在全新的赛道上,芯生视界的积累不仅在算法上,更在于我们的创始团队在临床一线多年,积累了海量的颅内多模态数据,包括百余例患者的视觉皮层电刺激的数据库。这意味着我们不需要从零开始进行临床试错。

02 万通道的可能

暗涌:现在受市场追捧的几家侵入式脑机接口公司,多是从“柔性电极”这一长板入手创业,而芯生视界的解决方案是什么?

李远宁:柔性电极是进入大脑的物理接口,这很重要。但脑机接口背后是一整套系统,真正决定脑机交互上限和信息通量的,是电极之下的芯片和神经编解码算法——这就是我们提出“神经显卡”的原因。

现在临床上使用的一些硬件可控性不高,也不是为了高效的双向交互设计的。就像显卡支撑了AI的爆发一样,芯生视界正在构建的“神经显卡”系统,攻克的是大脑极端高带宽数据流的“编解码-重建”闭环,它有可能成为支撑脑机融合、人机共生的核心基础设施。

暗涌:业内也有一种声音,脑机接口系统并不一定需要超高通量。马斯克Neuralink开始时植入了1024通道的脑机系统,但实际发挥作用的也只有几百通道?

李远宁:不同任务对通量需求不一样,运动控制需要记录的维度较低。比如手臂运动,只需要不到十个自由度的神经信号,就能实现在二维平面上精准地控制鼠标。

而目前所有语言解码的工作,本质上也是解码构音器官的精细运动:只需要十几个自由度的神经信号,就能很好的刻画口唇舌咽等构音器官运动,并解码生成出语音。

但真正的视觉重塑和自然语义解码,是另一个量级的工程。你想在盲人的脑海里像素级写入一张清晰的图像,或者直接解码“脑海中飘过的一个复杂抽象想法”,每一个环节对应的都是上千或者上万维度的信息并发。这时,高通量电极和高通量芯片的必要性就出来了。目前马斯克的Neuralink能做到 3000 个通道,我们正在朝万通道努力。

暗涌:所以你们认为必须开发高通量的脑机芯片。做脑机芯片的难点有哪些?

李远宁:脑机芯片是“带着镣铐跳舞”。要把这样的芯片植入到大脑,既需要小尺寸、低功耗,又要满足高通量实时并发,还要能够双向交互。

这件事并不是无解,和 GPU 相比,当下脑机芯片制程没有那么高。但是在没有规模化的情况下,利润就会很薄。芯片研发很烧钱,小规模流一次片可能就成百上千万。

而脑机领域才刚刚起步,投入多少资源,决定能解决多少问题。从这个视角来看,对比芯片、具身智能等方向,脑机接口赛道获得的资金规模还是比较少。

暗涌:你们的脑机芯片方案目前是什么进展?

李远宁:我们是国内为数不多流片出28nm级脑机芯片的团队,目前的芯片是256通道,今年应该会出一个更高通量、双向交互的芯片。

03 视觉与语言重建的未来

暗涌:为什么“视觉重建”成为大家现在想要攻克的重要方向?你们团队在此的积累有哪些?

李远宁:从临床需求来看,视觉重建的需求量足够大,且现在没有好的替代解决方案。中国最常见的三种残障类型是肢体、视力和听力残疾,其中肢体残疾有义肢等方案,听力障碍也有人工耳蜗的方案能够部分解决。但在视力障碍领域,针对全盲患者,植入式脑机接口几乎是唯一的复明方案。

从研究路径来看,它的第一步验证路线足够清晰。初级视觉皮层有retinotopy机制,即刺激皮层对应的位置,就能产生色觉和光感。

王茜老师早在2020年就开展了相关研究,让被试者在受到皮层电刺激之后,描述视野中什么位置产生了画面。比如把视野分成几块后,患者可以感知到左边有红色,右边有蓝色。得益于国内临床资源等优势,此前已研究积累了100多例的实验数据,部分解决了视觉皮层自下而上的简单输入问题。

在复杂场景的视觉编码算法方面,神经编码领域有一个两年一度的国际挑战赛叫 Algonauts, 主办方会给出一个公开的神经大数据集,要求参赛者提交算法,基于给定的刺激内容来尽可能准确地预测大脑的神经响应活动。这个比赛,2021年和2023年我们团队都拿了全球冠军。不过,2025年我们没有再参赛,而那一年的冠军是 Meta AI。

暗涌:此前有脑机接口专家讲到,视觉重建的难度非常大。为什么让“盲人复明”存在巨大挑战?

李远宁:因为还有两个关键的问题没有解决。

首先是动态视觉中大脑对环境的补全机制。我们看世界时,人脑每一刻其实只会接收到很小范围的视觉信息:我们视网膜中真正具备高分辨率的区域非常小,大脑是依靠眼球高频的扫视,结合内部建立的世界模型,来脑补和拼接出完整、连续的视觉场景。

这套机制也导致脑机接口的重建异常困难,因为初级视觉皮层并不是简单的前馈网络,存在大量的横向抑制和跨脑区的反馈连接,一个神经元的激活会横向影响周围的神经元,也就是说点亮一处可能会影响另一处,这就加大了视觉编码重建的难度。如果把一万个电极当成一万个独立的像素点去简单粗暴地同时激发,大概率会得到一片模糊。

另一个困难是如何利用神经可塑性,让大脑学会接受这样的输入,产生感知。当我们将经过算法编码的电信号输入盲人的大脑时,对大脑而言,这是一种从未见过的新型“语言”。

盲人并非一接上设备就能立刻“看懂”世界,而是需要经历一个类似“强化学习”的主动适应过程。这本质上是利用神经可塑性,让人机共同进化,最终帮大脑重新“长”出一条感知通道。

暗涌:脑机接口做视觉、语言这两种功能的重建及研究,对“人机交互”未来的意义是什么?

李远宁:语言和视觉,是我们跟世界交流最核心的输入和输出,视觉提供了我们80%的感知输入,在大脑深处构建起复杂的“世界模型”;语言则负责将这些意识解码并向外输出。

但语言本身,其实是受制于人类运动器官物理约束的一种低带宽的有损压缩。芯生视界的终极目标是打破这种束缚,实现高通量的人机交互,在人脑的高维语义空间与大模型、具身AI之间,架起一座直接对接的桥梁。

未来,思想的交互也许不再需要被降维成显性的语言或动作。人脑或能与AI实现语义级的直连。这可能不仅是人机交互的终局,更是碳基生命与硅基智能跨越物理边界、走向融合共生的进化一跃。