“伴随着老龄化加剧,大家更关注自身健康管理,目前来看,有价值的数据不仅仅局限在医疗机构,还有来自体检中心、医药电商、保险公司、可穿戴设备厂商,等等。这些数据反映了个人健康的侧面。通过隐私计算,可以打通这些数据,让健康管理的各个环节更加全面。”

由中国信通院云计算与大数据研究所、蚂蚁集团等共同举办的可信隐私计算高峰论坛上,瑞莱智慧CEO 田天作主题分享,探讨隐私计算在医疗领域的应用。

医疗数据共享面临三大难题

医疗领域拥有大量数据,有非常强烈意愿推动数据共享,但从目前来看,主要有三个方面的障碍:

一是技术问题,或者说是标准问题。基于大数据分析,医疗机构已陆陆续续构建了大量不同的信息系统,系统之间存在标准不一致、数据难以打通的问题,单个机构之内形成大大小小的“数据孤岛”,打通多家医院、多个中心将面临更加复杂的数据流通、数据标准障碍等问题。

二是合规问题。《个人信息保护法》《数据安全法》等的发布,对数据流通提出了非常高的要求。医疗数据特别在于,它涉及到核心的个人隐私信息,每个人都不希望自己的健康数据随意泄漏,更进一步来说,还涉及到个人的基因信息等等,直接关系到国家安全。

三是动因问题,或者说意愿问题。医疗数据的参与者能否在数据流通、数据公开过程中获得相应收益?比如说在传统诊疗或者医药研发过程中,每家药厂都要寻找大量的测试者,他们可以获得新型疗法的优先使用权,以提高参与度。但医疗数据是属于个人还是属于医院,存在比较模糊的边界地带;如果医疗数据的应用产生收益,能否回到患者本人手中,或者医院能否合规获得这部分收益,等等,都没有明确界定。在分配不清晰的情况下会导致开放医疗数据意愿不强。

数据不仅局限在医疗机构

针对上述问题,田天认为,隐私计算正好提供了非常好的解决方案,可以平衡医疗数据开放应用、安全保护还有利益共享等多个方面的诉求。具体来看,医疗领域隐私计算技术有几大应用场景:

一是服务临床辅助诊断。医疗诊断环节已经构建了大量的AI模型,基于病历文本数据或诊断过程中的影像数据等通过AI模型输出诊断结果,辅助临床医生通过更加客观数据以及决策给出最终诊断结果,不过,通过单个医院数据构建诊疗模型过程中经常出现数据量不足或者是样本不够的情况,基于每家的单一数据模型都存在偏差,因此,通过在不同医院布置联邦学习节点,进行分布式模型训练,获得多家数据训练诊断模型。此举增加样本代表性。

二是服务医学科研。医疗科研也存在数据量少以及数据难以沟通的问题,还有很多非常前沿的人工智能模型,比如深度生成模型,对数据处理和隐私计算能力要求更高。

以三甲医院为例,每家医院都有自身的优势学科和劣势学科,比如医院A可以实现可信执行环境的节点,三甲医院都可以把针对医院A的优势学科数据,以加密和授权情况下实现集中。对医院A来说可以获得更多数据,就可以实现更加复杂的科研任务;优势学科取得新的科研成果之后,反过来共享给整个联盟内其它参与单位,每家医院的优势学科都得到进一步增强,劣势学科也得到了补充,最终形成多方共赢的结果。

三是服务AI医药研发,特别是新药研发。新药研发有一个“双十定律”,要十年时间、十亿美金投入才能得到新药。通过人工智能一边可以降低新药研发时间,一边可以降低新药研发成本。新药临床试验中经常会看到大量广告,让大家主动报名,但药企也没有办法拿到医院的数据,并不知道哪些患者是最适合来参与实验的,导致报名参与非常低效。而通过隐私计算则可以找到对象,加速新药研发流程,它将药企和医院沟通数据的方式更加合规、高效,同时确保没有信息泄漏。

田天说,上述三个领域关注的是医疗核心环节,在整个医疗或健康管理全生命周期,都需要更多数据来做支撑,随着更加安全可信的人工智能发展以及隐私计算技术的发展,人工智能和大数据可以赋能更多新的行业。

【记者】郜小平

【作者】 郜小平

南方产业智库