在接下来的五个月里,机器学习专家们将尝试预测一位因神经退行性疾病而失去说话能力的脑机接口( BCI ) 用户的言语。参赛者将设计算法,根据患者的脑部数据预测词语。算法在预测句子和实际尝试句子之间误差最小的个人或团队将赢得 5,000 美元的奖金。
这项名为“脑转文本”的竞赛是第二届年度公开开源脑转文本竞赛,由BrainGate联盟旗下的一个研究实验室主办。该联盟自 21 世纪初以来一直在脑机接口临床试验方面处于领先地位。今年,该竞赛由加州大学戴维斯分校神经假肢实验室。
从大脑数据解码语音
INTRODUCTION
从脑数据中解析单词分为两个步骤:首先,算法必须根据神经数据预测语音(称为音素)。然后,算法必须根据音素预测单词。参赛者将使用与Harrell 试图表达的10,948 个句子对应的脑数据以及相应的文字记录来训练他们的算法。
接下来是真正的考验:算法必须根据训练数据中隐藏的脑数据,预测1450 个句子中的单词。最终预测的单词集与 Harrell 尝试说出的单词之间的差异被称为词错误率——词错误率越低,语音脑机接口的整体效果就越好。
研究人员报告的单词错误率为 6.70%,他们希望公众能够打破这一记录。加州大学戴维斯分校博士后研究员、临床试验和比赛负责人尼克·卡德表示,比赛的目的是吸引那些可能尚未意识到自身技能对语音脑机接口价值的机器学习专家。
“我们可以把这些数据藏在内部,然后随着时间的推移利用它们做出更多发现,”卡德说道,“但如果我们的目标是让这项技术更快成熟,帮助那些现在需要从中受益的人,那么我们希望分享这些数据,也希望人们能帮助我们解决这个问题。”
宾夕法尼亚大学教授康拉德·科丁 (Konrad Kording)使用机器学习研究大脑,但他并未参与这项研究或比赛,他表示,邀请公众进入研究领域是 BCI 领域“早就应该实现的”“一项了不起的进展” 。
今年,卡德和他的同事们利用他们自己的高性能算法,降低了起始词错误率,从而提高了标准。2024年首届脑转文本竞赛开始时,斯坦福大学团队的错误率为11.06%,最终获胜者的错误率仅为5.77%。今年还新增了现金奖励,奖励对象为错误率最低和最具创新性的方法,这些奖励由脑机接口公司Blackrock Neurotech提供。
脑机接口数据共享的伦理问题
INTRODUCTION
脑机接口 (BCI) 长期以来一直是神经科学、医学和机器学习之间的桥梁。机器学习有着开源研究的传统,而医学研究则受到患者隐私的约束。
北卡罗来纳州立大学哲学、科学、技术和社会学教授、生物伦理学家Veljko Dubljević表示,公开大脑数据的主要担忧是患者的身份会被识别出来。
在这种情况下,这种担忧是没有意义的,因为哈雷尔是在 2024 年 8 月公开露面的,大约在他因肌萎缩侧索硬化症(也称为卢格里格氏症)开始失去肌肉张力的五年后。2023 年,加州大学戴维斯分校的神经外科医生将四个电极阵列(共计 256 个电极)植入到他的大脑最外层。去年,哈雷尔在接受《新英格兰医学杂志》采访时,利用他的语音脑机接口技术,解释了这种疾病就像经历一场“慢动作车祸”的感觉。哈雷尔当时说:“失去沟通能力非常痛苦,尤其是和我的女儿。”
语音脑机接口的训练数据来源于哈雷尔在实验室进行实验时以及与家人朋友随意交谈时收集的数据。但卡德表示,脑转文本 '25 的竞争对手将不会看到哈雷尔随意即兴讲话时记录的任何“个人使用”数据。
实验室-社会共创
SIGNIFICANCE
这场“脑转文本”竞赛的意义,并不仅仅在于奖金或技术比拼,而在于脑机接口研究从封闭实验室走向开放协作的转折。过去,语音脑机接口的算法优化大多掌握在少数实验室和科研团队手中,创新速度受限。而现在,研究人员选择将真实的大脑数据公开,邀请全球的机器学习专家甚至普通爱好者参与改进,这相当于把科学前沿的问题交到大众手里,让更多的智慧汇聚在一起。
这种开放模式,一方面能加快语音脑机接口的迭代速度,让丧失语言能力的患者更快用上精准的沟通工具;另一方面也在改变脑机接口的发展逻辑:它不再只是医学与神经科学的专属领域,而成为一个跨学科、跨群体共同参与的创新平台。同时,公开大脑数据也带来了伦理和隐私的讨论,这让社会更早地面对并思考脑机接口大规模应用可能引发的风险。这种提前的争论本身,就是技术负责任发展的重要保障。
总体而言,这场竞赛的意义在于推动脑机接口从“实验室成果”走向“社会共创”。它不仅仅是解码语音的技术挑战,更是一次让科学、产业和公众共同塑造未来沟通方式的尝试。
新闻来源:IEEE SPECTURM
热门跟贴