在人类基因组学研究领域,样本量是关键。2023年11月,英国健康研究机构UK Biobank向全球科学家公开了近50万样本的全基因组测序数据。这些测序数据与参与者的长期健康指标相结合,提供了详细的基因信息和表型信息。表达有差异,差异影响表型,我们有了更多的公共数据资源,以实现用别人的数据,发自己的文章的目标!
UK Biobank官网:https://www.ukbiobank.ac.uk/
正如官网所说,UK Biobank绝对是The world’s most important health research database!自2006年成立以来,UK Biobank收集了50万名来自英国40-69岁志愿者的共1500万份样本的数据,既有基因测序的数据,也有样本信息和全身扫描等资料,可用于研究遗传因素、环境因素、生活习惯等与人类健康重大疾病的关联。对于样本收集,UK Biobank做了大量的调研工作,并制定了非常明确的前处理和存储策略,保证收样和数据的科学、规范、可靠。
在Biobank官网有一段话,值得学习:Data drives discovery. We have curated a uniquely powerful biomedical database that can be accessed globally by approved researchers. Explore de-identified data from half a million UK Biobank participants to enable new discoveries to improve public health.
然而,2026年4月23日,英国科技部长Ian Murray在下议院紧急发表声明:UK Biobank约50万志愿者的去标识化健康数据,被发现在阿里巴巴平台公开出售。数据源于三家中国研究机构。这些机构此前合法申请并获得UK Biobank的数据访问权限,正规渠道下载去标识化的参与者数据,然后,这些数据就被挂到阿里巴巴上出售。这件事感觉还是挺丢人的。
图片来自博士后的小酒馆公众号,仅用于分享
热门跟贴