对临床医生而言,临床工作与科研的双重压力日益加剧:既要完成繁重的临床任务,又面临晋升所需的科研产出要求。UK Biobank作为全球领先的大规模生物医学数据库,目的是探求一些特定基因、生活方式和健康状况之间的关系,提高对一些遗传类疾病致病基因的理解,包括癌症、心脏病、糖尿病和一些特定的精神疾病,为临床医生提供了突破时间和资源限制的独特机会。
UK Biobank数据库包含50万名40-69岁参与者的深度数据,收集了遗传、身体和健康数据,包括基因信息和血液样本、生活方式及环境暴露数据,并已对10万参与者进行了全身影像扫描,每人产生超过12,000张影像。这一前所未有的开放获取数据库使大量与健康相关的研究成为可能。
UK Biobank数据库资源规模空前
50万参与者的深度基因型数据与表型数据
全基因组测序数据覆盖所有参与者
15万参与者的全身多模态MRI扫描数据
长期随访数据包括住院、癌症登记、死亡登记等
10万样本的血浆蛋白质组学数据
5万样本的血浆代谢组学数据
培训目标
1,掌握UK Biobank数据库申请全流程,有效规避申请过程中的典型错误。
2,通过临床科研真实案例,帮助学员高效获取并分析UK Biobank与临床实践紧密关联的数据。
3,将临床问题转化为可研究的数据科学问题,搭建从临床思维到研究实践的桥梁。
4,完成一项可直接应用于研究课题的项目方案,实现“学即能用”。
5,理解如何将UK Biobank数据与自有临床数据结合
培训时间
2026年01月09日— 2026年01月12日远程在线培训
(第一天数据及操作软件调试,共授课三天)
主讲专家
来自清华大学、上海交通大学、中国科学院等高校医学生物信息学学科带头人、擅长各类型医学数据统计分析、生物医学大数据挖掘。发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作。参与多家三甲医院临床生物信息学的研究合作,科研及授课经验很丰富。
参加对象
各省市、自治区从事临床医学、基础医学、生物医学工程等科室主任医师、副主任医师、住院医师等临床科研工作者相关人员;国内各重点大学、科研院所相关研究领域的博士、硕士相关研究生和学者等:
课程大纲
一、准备部分
一、R语言基础
1.R语言的数据结构
2.R语言的基本操作
3.R语言中外部数据的导入
4.R语言的基本统计
5.R语言的基础绘图
二、临床研究概述
1.常见临床SCI文章类型
2.临床研究分类
3.临床研究统计学基础
4.混杂因素与交互作用
5.临床研究回归分析
6.倾向性评分匹配(PSM)
7.危险因素研究
8.临床预测模型
9.临床工具变量回归
10.广义相加混合模型
二、UKBiobank数据库概述
一、UKB基本信息和页面概况
1.UKB总体介绍
2.UKB数据收集产生
3.UKB数据的基线阶段:问卷调查、体测、生物样本采集;
4.UKB数据的队列阶段:在线随访、主题问卷、慢性病跟踪
二、UKB数据使用流程
1.UKB数据申请资格审查
2.UKB数据完整申请
3.UKB数据释放
4.UKB数据合规研究
5.UKB数据研究通报
三、UKB数据特点
1. UKB数据的更新
2.UKB数据支持的研究范围
3. UKB关联的非肿瘤疾病类型数据
4. UKB关联的肿瘤疾病类型数据
5. UKB关联的死因分析数据
6. UKB数据关联的变量
7. UKB的生活方式、健康病史、诊断检查、家族环境、基因组学数据
8.UKB与其他数据库联合分析介绍:联合NHANES高分论文介绍。
四、UKB数据模块分类
1.人口特征
2.生物样本
3.基因组学
4.健康结局
5.在线随访
6.原始数据
五、实操演示
1.UKB数据检索技巧与策略
2.UKB数据下载与数据结构讲解
六、研究案例与应用
1.UKB常见和热点数据字段介绍:
睡眠规律指数、社会经济地位、穿戴设备指标(如⼿腕温度节律)
2.R语言数据预处理
3.UKB研究变量制备代码演示
三、UKBiobank数据界面介绍
一、UKB重要页面导览
1. UKB主页
2.UKB关于数据
3.UKB健康相关
3. UKB基线测量
4.UKB项目管理
二、UKB数据相关页面
1.数据介绍
2.数据理解
3.数据浏览
4.数据搜索
5.数据字段
6.数据格式
7.合成数据
8.死亡报告
9.癌症报告
10.癌症详情
11.工具下载
三、UKB数据分析工具
1.离线分析工具
2.在线分析工具
四、UKBiobank原始数据模块介绍
一、评估中心
1.触摸屏
2.人口统计学
3.早年经历
4.性别特异性
5.认知能力和口头访谈
6.体格检查和眼科测量
7.影像数据
二、生物样本
1.血细胞计数
2.血液生化
3.传染病
4.核磁共振代谢组学
三、在线随访
1.心理健康
2.24小时召回饮食
3.食物和偏好
4.工作环境
5.在线认知功能
6.消化道健康
7.疼痛体验
四、额外暴露
1.当地环境
2.身体活动测量
3.心脏监测
五、健康相关结果
1.基础护理
2.住院数据
3.首次出现医疗状况
4.死亡登记
5.癌症登记
五、UKBiobank数据字段关键参数
一、数据字段信息
1.Date-Field
2.Description
3.Category
4.Participants
5.Item cont
6.Stability
7.Value Type
8.Item Tyle
9.Strata
10.Sexed
11.Instances
12.Array
13.Debut
14.Version
15.Cost Tier
二、数据字段信息
1.Data
2.Notes
3.Related Data-Field
4.Resources
5.限制数据
三、数据检索实操
六、UKBiobank数据下载
一、AMS账户页面介绍
二、从AMS 的 Basket 上下载数据
三、RAP平台介绍
七、UKBiobank研究案例
1. 睡眠规律指数(Sleep Regularity Index)及相关论文
2. 社会经济地位(Socioeconomic Status)及相关论文
3. 虚弱指数(Frailty Index,FI)及相关论文
4. 加速度计 (Accelerometer)及相关论文
5. 三酰甘油-葡萄糖指数(TyG)及相关论文
6. 握力及相关论文
7.空气污染及相关论文
8.尚未被广泛关注的高级指标
9. 建立自己所需的指标
八、研究变量制备
一、研究变量制备示例论文
二、研究变量制备导图
三、变量搜索方式1 Browse by Primary Category
四、变量搜索方式2 Search
五、SES定义
九、UKBiobank论文产生流程
一、UKB相关论文“踩分点”
二、UKB论文的选题
1.代谢相关研究
1.1UKB代谢标志物
1.2代谢疾病领域典型论文
2.心脑血管研究
2.1 UKB心血管疾病相关变量
2.2心血管疾病领域典型论文
3.肿瘤研究
3.1 UKB肿瘤相关变量
3.2肿瘤疾病领域典型论文
4.精神疾病研究
三、UKB论文的数据处理
四、UKB论文的统计分析和展示
五、UKB论文的写作
六、UKB挖掘的三个阶段
1.准备阶段
2.初步阶段
3.多数据库联合
4.多方法联合
5.多PI联合
十、UKBiobank数据库挖掘实战
一、UKB数据提取与预处理
1. 社会人口学变量
1.1变量类型、命名规则、观测函数
1.2家庭收入变量:编码规则、缺失数据处理、
1.3种族变量:编码简化、处理原因、R代码示例
1.4学历变量:变量特点、处理建议、编码说明
1.5汤森贫困指数:变量特征、分类方法、R处理示例
1.6就业状况变量:原始编码、简化处理、R代码示例
2. 生活方式变量
2.1吸烟:变量构成、编码方法、预处理逻辑
2.2饮酒:变量构成、编码特点、计算方法、注意事项
2.3饮食:评价维度、评分标准、蔬菜摄入计算:变量构成、编码规则、计算方法、处理原则、各成分具体标准
2.4 睡眠:变量维度、变量选择依据、健康睡眠评分、高阶睡眠指标
2.5 体力活动:MET的定义与计算、体力活动的编码方式、体⼒活动分类变量、⾼阶体⼒活动指数与运动时间规律性
2.6 额外暴露变量:空⽓污染、核⼼指标、预处理⽅法
3.病史变量
3.1主要病史变量
3.2基础疾病合并处理
3.3高血压
3.4冠⼼病
3.5糖尿病
4. 健康相关结局
4.1健康结局变量
4..1.1ICD-10编码系统
4.1.2⼊院诊断变量:变量结构、数据特点、相关变量
4..1.3 特定疾病时间计算
4.2癌症结局变量
4.3死亡相关变量
4.4首次出现变量
4.5数据预处理
二、基于UKB的模型构建
1.模型构建的思路与关键点
2.Y变量的确定
3.X变量的确定
4.混杂因素的控制
5.双重关联
6.实践要点
7.实例分析
三、多元线性回归
1.模型核心概念
2.模型参数解释
3.logistic模型基本介绍
3.1模型特征:数据要求、样本量估算
3.2转换原理
4.Cox回归模型基本介绍
4.1生存分析
4.2生存影响因素分析
4.3不同人群生存比例差异分析
4.4Cox回归模型
四、模型构建实战演示
1.线性回归模型的构建与系数解释
2. logistic回归模型的构建与系数解释
3. 建Cox⽐例⻛险回归模型的构建与系数解释
五、基于UKB数据库的亚组分析
1. 亚组分析的背景和意义
2. 亚组分析的⽅法和模式
2.1案例⼀:降糖药物疗效评估及UKB特殊考量
2.2案例⼆:UKB健康⼲预研究
3.R语言实现
六、基于UKB的潜在类别分析
1. 潜在类别分析的背景和意义
2. 潜在类别分析样例
3. 潜在类别分析基础概念
4. 潜在类别分析⽅法
5. UKBiobank中的潜在类别分析
5.1社会经济学地位分析
5.2慢性病分析
5.3体检结果处理
5.4⽣物标志物处理
5.5⽇常⾏为数据
5.6选题⽅向
5.7注意事项
十一、辅助课程
1.学后交流、微信群、QQ群建立。
2.咨询、合作,技术团队深入探讨。
3.专题定制化内训。
国内外学者已见刊文章
1,糖尿病和贫血之间的关联:来自NHANES和英国生物库的证据
2,共有490640名英国生物库参与者的全基因组测序
3,每日总体力活动量和强度、步数和癌症事件风险。来自英国生物库的证据
4,UKB-MDRMF:基于英国生物库数据的多疾病风险和多发病率框架。
5,肠易激综合征与全因和特定原因死亡率之间的时间依赖性关联:英国生物库内的一项前瞻性队列研究
6,心房颤动会增加全因性痴呆、阿尔茨海默病和脉管系统疾病的风险:英国生物库373415名参与者的队列研究
培训费用
每人4300元(含培训费、教材费、证书费、资料费)
医咖会会员立减300
发票可开:会议费、培训费等
联系方式
联系人: 小咖3号
微信号:xys2019ykh
二维码:
热门跟贴