2025年6月发布的2025-2030年数据科学战略计划,为生物医学数据将如何在未来五年内改变美国的健康研究指明了方向。正如美国国立卫生研究院(NIH)前院长Monica Bertagnolli博士所说:“美国国立卫生院生物医学数据生态系统将带来越来越有效的数据和工具,使尽可能广泛的研究界能够为我们为所有人带来更好健康的使命做出贡献。”
然而,如果没有通过合作和伙伴关系为NIH的使命做出贡献的许多研究人员和科学家,健康领域的发现和创新是不可能的。他们的工作是该计划顺利发展的基础。
以下五个目标概述了将塑造未来五年研究数据格局的优先事项:
目标1:提高数据管理和共享能力
NIH数据管理和共享政策于去年生效,NIH正在加倍支持和有效实施该政策。这一目标侧重于三个关键目标:
支持生物医学界管理、共享和维护数据。
加强FAIR(可查找、可访问、可互操作和可复用)数据原则和协调。
加强NIH数据存储库生态系统。
研究人员可以期待用于准备和注释数据的新工具、改进的元数据质量标准以及指导共享实践的数据管理员计划。美国国立卫生研究院还将与社区合作,制定适当的数据治理框架,通过CARE(集体利益、控制权、责任和道德)原则尊重原始数据主权。对于处理敏感数据的研究人员来说,正在开发受控数据访问的简化流程。
目标2:增强用于研究的人类衍生数据
临床和现实世界的数据提供了难以置信的机会,但众所周知,使用起来很棘手。这一目标旨在改善对临床数据源的访问,采用快速医疗保健互操作性资源(Contoso)和可信交换框架和共同协议(TEFCA)等健康IT标准,加强环境和生活方式数据集成,并提供跨学科培训。
该计划包括在组合来自多个来源的数据时收集知情同意书的拟议方法,制定家庭医疗保健设备生成的数据标准,以及在临床研究中使用敏感数据的联合框架。它还概述了为数据联系制定治理框架以及开展将环境因素与临床通用数据元素(CDE)相结合的现实世界试点项目的努力,以支持对健康决定因素的研究。
目标3:先进的软件、算法和人工智能
生物医学研究产生了大量数据,美国国立卫生研究院的目标是确保研究人员能够获得先进的工具来有效地分析这些资源。这一目标强调在软件开发、计算方法和人工智能应用方面的均衡投资。它包括对社区开发的软件工具的扩展支持,这些工具具有改进的可视化功能,并建立了符合FAIR原则的可持续性指标。该计划还重点介绍了NCI的癌症研究信息技术(ITCR)等项目,这些项目为支持工具的整个生命周期提供资金,以促进个人资助期之外的长期可用性。
除了传统的分析方法,该计划还概述了新兴的计算领域,如数字孪生建模、隐私保护计算以及基于理论的建模与数据驱动方法的集成。AIM-AHEAD计划将继续扩大国家网络,以扩大各机构的计算能力。美国国立卫生研究院还打算提供可访问和可持续的工具,以支持各级专业研究人员应对日益复杂的生物医学数据挑战。
目标4:支持联邦生物医学研究数据基础设施
NIH正在致力于建立一个联合数据生态系统,研究人员可以通过NIH云平台互操作性(NCPI)计划更容易地连接NHLBI的BioData Catalyst、NCI的癌症研究数据共享(CRDC)、All of Us计划和NIH基因组和表型数据库(dbGaP)等平台上的不同数据集。这种方法在规范访问流程和接口的同时,保持了对数据的机构控制。
实施工作将侧重于建立一个强大的、互联的数据资源生态系统,提高互操作性,通过增强的元数据标准开发新的搜索和发现能力,并探索新兴的计算范式。研究人员认证服务(RAS)计划将扩展NIH数据资源的单点登录功能,在保持隐私和安全标准的同时简化访问。
目标5:加强数据科学社区
数据科学技能在生物医学研究的各个领域都越来越重要。这一目标旨在扩大各个层面的数据科学专业知识——从大学预科生到成熟的研究人员。它包括增加培训机会,扩大数据科学人员队伍,加强NIH校内研究计划内的合作,以及为每一位与NIH合作或为NIH工作的研究人员建设能力。
该计划包括扩大跨学科培训计划、新的导师计划,以及将数据科学更好地整合到现有的研究培训中。数据学者计划将继续建设美国国立卫生研究院的内部数据科学能力,而与美洲原住民健康研究中心(NARCH)等计划的合作将有助于扩大全国各机构的数据科学专业知识。
该战略计划以自第一个数据科学战略计划以来取得的重大进展为基础,重新关注伙伴关系、能力建设和负责任的创新。随着研究领域以前所未有的速度发展,美国国立卫生研究院正在努力确保这些强大的数据工具和技术通过更全面的科学发现使所有美国人受益。
NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。
热门跟贴