9月,美国卫生高级研究计划局(ARPA-H)同Duality科技公司签署一份价值高达600万美元的合同,以开发一个框架,使医疗机构能够共享高度敏感的患者数据。如果成功,该项目将使较小的医疗机构能够安全地访问敏感的健康数据,对罕见疾病进行研究,包括对少数族裔有不同影响的疾病。

打开网易新闻 查看精彩图片

“罕见病”这个词有点用词不当,虽然一些疾病在统计上非常罕见,但事实是,美国大约20%的人口在其一生中的某个时候受到罕见疾病的影响。Duality的首席技术官兼联合创始人Kurt Rohloff表示,虽然对罕见病的研究很活跃,但其中大部分是针对具有西北欧背景和遗传学的人。

Rohloff说:“除了北欧和西欧传统个体的经典焦点之外,人们对突变与癌症或其他类型疾病之间的遗传学和基因构成以及突变相关性的了解要少得多。”

大型医疗机构,如Broad Institute, Mass General和ntermountain Health,本身就拥有大量有价值的数据,可以对罕见病等进行医学研究。然而,Rohloff说,他们掌握的大部分数据都偏向于具有欧洲遗传的人口中心。

好消息是,如果这些大型医疗机构想要某个城市的数据集,他们有法律资源来编写数据使用协议,提供必要的隐私保护。

“这没什么不好的。他们有管理政策,规定他们在接收数据时如何处理数据,以保持数据的隐私和安全。所有的最佳实践。他们做得很好,”Rohloff说。“挑战在于,当你去较小的组织、中端市场健康中心、研究中心、中端大学研究中心时,他们不一定有无限的法律预算资源。”“他们没有无限的IRB(机构审查委员会)活动。他们基本上需要加快数据访问的方法,而不一定需要律师时间。”

打开网易新闻 查看精彩图片

这就是启动新ARPA-H项目的目标。该项目被称为SQUEEZES,将使用Duality的全同态加密(FHE)技术,使美国的农村和本土医疗机构能够汇集他们的医疗数据并进行分析,但不允许彼此读取。

医疗机构在将其数据用于罕见病研究之前,仍需要获得个人的同意。但是,由于数据始终保持加密状态,因此获得必要同意所需的法律工作量减少了,Rohloff说。

“所有这些不同的组织……都有自己的数据,”Rohloff说。“一个组织会使用本地加密密钥在本地加密数据……并将其上传到服务器,服务器可能位于癌症研究中心。多个农村或部落卫生机构可能会这样做,每个机构都用自己的密钥加密。”

一旦所有加密数据都集中起来,就可以在Duality的FHE环境中对其进行分析并用于构建机器学习模型。

“例如,这可能是基于协变量的模型,或者只是简单的相关型模型,用于确定哪种突变指示某些类型的癌症,”密歇根大学电气工程和计算机科学(EECS)博士Rohloff说。“你会得到更高质量的模型,更准确的结果,并可能看到你通常看不到的东西。”

他说,这是一种混合了FHE的联合学习形式。

Rohloff说:“所有这些都是加密的。你运行分析,得到加密的结果。”“我们可以将加密结果发送回每个提供数据的卫生机构。每个机构基本上都可以使用其本地密钥运行审批流程……基本上授予分析方访问权限,这样如果加密数据的所有数据贡献者都同意或同意访问……那么分析方最终就能得到结果。”

打开网易新闻 查看精彩图片

Rohloff说,构建这些类型的系统并不容易。虽然FHE由于性能不佳而在某些圈子里受到了不好的评价,但这些主要是由于实施不佳。 “设计在隐私技术之上高效运行的工作负载确实需要一点技巧和经验。”“做得不好的同态加密会带来性能损失。”

Duality以前已经建立了这种系统,包括与Dana-Farber癌症研究所、特拉维夫医疗中心和其他机构合作。作为ARPA-H项目的一部分,它正在开发的系统旨在成为FHE开放式架构的参考实现,可以更广泛地部署。

Duality能否成为FHE的红帽还有待观察。该公司是同态加密领域无可争议的领导者,已被证明是有效的。随着该公司建立商业基础,它很乐意在此过程中做一些好的工作。

打开网易新闻 查看精彩图片

Rohloff说:“我们使命的很大一部分是实现敏感数据的安全协作。”“无论是帮助组织以受隐私保护、受监管的方式共享金融交易数据以打击金融犯罪、减少欺诈、停止洗钱或反恐融资,还是帮助癌症研究中心共享数据以开发更好的罕见病治疗方法,并帮助部落卫生中心和农村卫生中心等历史上代表性不足和服务不足的社区,这都是我们所做工作的重要组成部分:为整体公共利益实现安全合作。”