摘要:由国家数据局联合中央网信办、交通运输部、农业农村部等15个部门共同启动了2024年“数据要素×”大赛,大赛评选出一批具有创新性和实用性的优秀项目案例,包含工业制造、现代农业、商贸流通、交通运输、金融服务等12大领域。本文整理了医疗健康领域“数据要素×”典型案例,以供各位读者参考和借鉴。
案例一
多模态健康医疗数据助力“AI+制药”新范式
生物医药产业是关系国计民生、经济发展和国家安全的战略性产业,是健康中国建设的重要基础。AI等新技术应用于靶点确证、先导化合物发现及优化、临床试验、药物上市后研究等环节,可以实现降本增效,化解医药研发“三座大山”(高投入、高风险、长周期)难题。而我国药企AI应用起步较晚,存在“数据孤岛”、“算法模型能力弱”、“算力资源卡脖子”等痛点问题。南京江北新区生物医药公共服务平台依托国家健康医疗大数据(东部)中心,实现覆盖江苏省全省的公卫临床诊疗和20PB多组学数据汇聚与应用,构建AI制药异构算力调度服务联盟,打造干湿闭环药物研发体系,形成一站式AI制药公共技术服务能力,为生物医药产业发展提供数据、算力及算法支撑。
一是构建多模态健康医疗大数据管理平台,推动海量数据汇聚管理。通过对接省级信息化平台API接口、部署大型科学仪器设备下机数据同步采集工具、公共数据库定期下载更新和产学研项目共建等方式,采用“MPPDB+Hadoop”混合架构实现多模态健康医疗数据管理,并研发生物医药领域通用数据处理、分析和隐私保护自动化工具,实现江苏省8000多万人的公卫临床诊疗数据、20PB多组学数据以及千万级化合物数据资源的统一汇聚。
二是依托多种分析技术提高数据处理效率与质量。公卫临床诊疗数据主要利用医学自然语言处理AI模型和大数据ETL技术,构建数据提取、脱敏、治理和质量评估标准化流程,实现标准化数据要素供给;多组学数据打破了传统单一组学研究方式,在常用生信分析技术基础上,引入迁移学习等技术,实现多组学数据联合分析与应用;化合物数据主要针对药物研发中存在的高质量数据不平衡问题,通过等变图神经网络等技术构建AI模型,实现统一建模不同类型分子的效果。
三是遵循“原始数据不出域,数据可用不可见”,保障数据安全。建立起“实名申请、快速审批、定点调取、分类使用、全程监控、多方监管”的数据安全共享管理规范和先行先试转化应用流程。同时采用安全认证、权限控制、数据加密/匿名化、配套数据安全计算环境、实行数据全生命周期管理等方式,切实保障数据存储与应用安全。
四是强化多模态数据融合与分析,推进数据驱动的药物研发创新。项目实施以来,已与100余家企事业单位在疾病药物/医疗器械真实世界研究、智慧医疗/精准医疗产品研发、药物发现与优化等应用场景开展合作,助力科研团队发现多个疾病新靶点和新活性分子,整体降低企业研发成本超千万元。
五是构建政府主导、多方参与的市场化可持续运营模式。通过市场化运营方式,面向生物医药行业科研和企事业单位提供算力资源服务、多组学检测服务、数据分析服务,实现国有公共技术服务平台的自我造血,保障平台持续具备数据汇聚与公共技术服务能力。
图1 AI制药平台整体架构图
案例二
数据要素赋能慢性鼻窦炎精准分型及治疗
慢性鼻窦炎是一种高度异质性疾病,影响着全球约6亿人的生活质量,现有诊断存在依赖人工、误差大等,严重影响临床诊疗和预后效果。中山大学附属第三医院通过构建慢性鼻窦炎病理亚型智能辅助诊断系统,从根本上解决慢性鼻窦炎病理炎症内在型分型困难问题,提高患者疗效和改善预后。
一是汇聚数据确保系统可靠性与普适性,利用湖仓一体技术确保病理数据结构化和深度治理。采用“湖仓一体”的大数据平台架构,解决不同机构、不同来源的慢性鼻窦炎数据统一存储和规范化处理的难题,对电子病历、检查、检验等多种模态数据进行标准化、归一化、后结构化等处理,实现传统数据对接周期从原来的9-14天缩短为1-2天,构建了高效、快速、便捷的取数、治数、用数的数据要素挖掘体系,形成了高质量的慢性鼻窦炎标注数据集和标注模型。实现全国24家基层医院及三级甲等医院的2657张慢性鼻窦炎伴鼻息肉病理切片数据采集汇聚,支撑慢性鼻窦炎智能显微镜亚型辅助判读系统和慢性鼻窦炎全玻片亚型辅助判读系统模型训练和临床测试验证。
二是依托AI能力结合高年资医生标注,提升数据质量和识别准确率。首先,在汇聚数据基础上,利用基于PA-P2PNet算法技术进行准确的细胞检测和亚型分类,并结合DeepLabv3+算法技术来分割上皮、微血管和腺体区域。由高年资病理医生标注符合训练的病理图片数据,保障数据质量标准和识别模式特征。其次,初次标注符合训练的病理图片数据进行再分割和手工标注,并在达到一定量的基础上增加算法优化模型,构建慢性鼻窦炎智能全玻片辅助诊断系统。再次,选择多家医院收集多张病理玻片,使用智能显微镜与全玻片病理亚型辅助诊断系统,分别与低、中、高年资病理医生进行分型准确率和诊断耗时对比。最后,收集多例患者队列,对比慢性鼻窦炎病理亚型智能辅助诊断系统和高年资医生识别的病理亚型诊断结果,并使用多因素逻辑回归建立复发预测模型,评估智能辅助诊断系统对患者预后的预测潜力。
三是建立全方位安全体系,保障数据安全共享流通。首先,网络安全方面,各网络区域的内部网络结合业务特性,通过VLAN方式实现网络逻辑隔离,除非经授权和审计,否则拒绝违规外联。同时,在对外提供WEB服务的出口边界处部署WAF,提供WEB应用层以及代码的防护能力;其次,权限管理方面,远程管理设备基于双因子认证机制,统一通过堡垒机开展运维操作,用户权限和访问范围根据用户角色进行分配。另外,利用AES-128、AES-256和SM4-XTS三种算法,通过内置密管和内置加密引擎,确保静态数据加密;最后,冗余备份方面,通过分布式存储,不同故障单元彼此隔离,最大程度保障数据存储的可靠性。同时,为不同的故障单元配备了热备冗余,最大程度保障数据存储的安全性和稳定性。
四是丰富场景应用,提升数据价值。慢性鼻窦炎智能病理亚型辅助诊断系统可快速、准确、全面识别不同亚型诊断,满足三级医院、基层医疗机构、远程会诊以及其他研发科研机构的智能诊疗使用,极大提升医疗机构对慢性鼻窦炎的诊断能力。目前,慢性鼻窦炎智能显微镜辅助判读系统与慢性鼻窦炎智能全玻片辅助诊断系统已在国内广泛推广和试用,其中,慢性鼻窦炎智能显微镜病理亚型辅助诊断系统、慢性鼻窦炎伴鼻息肉全玻片病理亚型辅助诊断系统的分型准确率分别为91%、90%,智能显微镜系统辅助诊断时间从193秒减少到8秒,全玻片系统辅助诊断时间从10450秒减少到250秒,诊断效率较传统方式显著提高了24倍。
五是推出多样化收费服务,构建可持续发展模式。慢性鼻窦炎病理亚型智能辅助诊断系统能为基层医疗机构和三甲医院的耳鼻喉科、呼吸科、病理科医生、医疗技术公司以及研究机构提供准确、快速、高效的慢性鼻窦炎病理内在型分型解决方案,通过提供一次性购买、订阅服务和平台使用量等多种收费服务形成可持续发展模式。
图1 慢性鼻窦炎病理亚型智能辅助诊断系统
案例三
中医药行业雷公大模型
中医药是我国独特的医疗卫生资源,党的二十大报告作出“促进中医药传承创新发展”的部署,国务院、国家中医药管理局及国家数据局等都发布了发展规划。当前,中医药产业仍然存在很多挑战,科学化种植管理技术缺乏,中药质量难以保证,中医资源、中药研发信息分布共享不均衡,中药材质量识别标准不统一,销售退换货成本增加等问题,严重影响中医药行业发展。云南白药集团股份有限公司通过打造中医药行业雷公大模型,构建统一、全链路的产业平台,将新兴技术与全产业链数据要素深度融合,助力推动中医药产业种好药、讲好药、开好药、卖好药,实现全行业、全产业链、全流程数据的有效贯通,推动中医药行业的数字化转型和发展。
图1 中医药产业面临的挑战
一是多元数据集构建行业标准体系。通过汇聚产业联盟共享数据、权威机构合作数据,企业应用场景沉淀数据,整合转化为中医药行业高质量数据资产,支撑数据交易和共享,赋能中医药行业各阶段不同场景的应用。
二是统一数据服务、模型训练技术范式和服务标准。从数据获取、数据清洗、数据标注和数据管理四个方面进行数据质量控制,确保数据的准确性、完整性和多模态的可用性;结合行业专属数据标注策略,校验确保数据规范性。针对中药材特色图像数据进行颜色、纹理及形状等特征提取,确保模型训练时能理解和完成处理。
图2 雷公大模型训练技术架构图
三是自主研发设计模型路由器与网关,保障数据访问安全。首先,提供标准化数据访问接口,统一管理应用的访问控制、负载均衡、缓存及安全功能。其次,通过大模型输入护栏进行输入层的安全控制,训练数据检测模型进行敏感信息的屏蔽,建立映射机制保障必要场景的安全使用,设置系统行为限制并进行人类审批,定义应用范围过滤争议话题的输入,利用异常检测算法识别恶意提示确保系统行为合规。最后,设立输出安全护栏控制输出层的安全,检测无效响应(空白、不规范格式)和不良输出(有害内容、事实错误、敏感信息泄露等),采取屏蔽、转人工或基于情绪分析模型完成处理。
四是基于大模型赋能多应用场景,提升数据价值。根据用户病史推荐个性化健康管理方案,结合体质提供健康养生建议,增强未病先防、已病防变意识。有效发掘、利用中药材效能,辅助企业研发、生产、营销决策。结合中医诊疗与中药研发数据,推动诊疗与研发的协同创新。通过数据共享和流通,促进中医药产业链各环节之间的协同合作。
五是构建多方联盟推进的可持续发展新路径。中医药雷公大模型通过技术复用性、场景扩展性以及能力沉淀,提升大模型训练工程化方法和标准,持续建设高质量数据集,赋能产业平台、中医药领域。同时,通过中医药产业联盟,进一步推进以数据要素和AI大模型技术为主的服务建设,更好服务于中医药各业务场景。
图3 雷公大模型赋能中医药行业
案例四
京通健康大数据平台
随着“健康中国2030”目标和“十四五”规划等国家政策的出台和推进,医疗行业数字化转型已上升到国家战略层面。目前,医疗行业面临着数据孤岛、数据安全和创新医疗服务三大痛点和挑战,严重阻碍了医疗行业数字化转型与改革创新的快速发展。亚信科技(中国)有限公司与联通(北京)产业互联网有限公司通过汇聚跨领域数据,构建“高效互联、集成共享、安全可靠、融合开放”的北京联通-京通健康大数据平台,实现数据分析和生产平台分离,建立主动智能预测系统,提升医疗生态系统效率和质量,推动医疗行业的数字化转型和智能化升级。
一是制定数据治理政策,促进数据互通共享。平台汇聚并整合预约挂号信息、就诊信息、检查检验结果、医疗影像结果等各类医疗健康数据,通过严格的数据治理政策,确保数据质量和一致性,促进不同系统和机构间的数据互联互通。目前已覆盖用户超2000万、就诊人数超3000万,基于海量用户预约数据和行为数据可开展相关医疗健康分析。
图1 数据支撑体系
二是运用多种工具将海量数据精准可视化。通过对134套库表中的2628个数据要素进行深度精炼与处理,利用数据可视化工具,将复杂的数据分析结果转换为直观的图表和报告。目前已实现了医疗数据大屏实时监测(10屏)、用户行为漏斗实时分析(2000万+用户)、电子黄牛实时鉴别与协同抵制(用户风险等级评估)、便捷就医(候诊排队、号源推荐等)、号源分级管理等功能,为患者就医指导、医疗资源画像、线上线下互联互通等提供了有力支撑。
图2 复诊用户画像
三是建立数据流通安全访问控制与权属机制,保障数据安全。首先,采用区块链、数据沙箱、加密、脱敏和访问控制技术,保护个人健康信息流通中的隐私和安全。其次,采用多因素认证和实时监控的方式,保障用户授权的真实性和有效性。最后,为每个数据元素创建一个不可篡改的“出生证明”,确保数据的管理权和使用权在平台上得到清晰界定,解决数据权属不明确的问题。例如,医疗机构对其所生产的数据有数据管理权,政府则有权基于公共利益进行数据收集和使用。
四是赋能多领域多场景应用,提升数据价值。一是平台通过整合多源数据,提供统一的预约挂号、医保移动支付、检验检查报告在线查询、候诊排队、疫苗接种、健康服务等多种服务,提升医疗服务的一体化、便捷化与智能化。二是平台通过整合各医疗机构和医药企业数据,结合数据分析服务,助力企业优化库存管理,减少药品浪费,提高供应链透明度和效率,确保药品的可追溯性,实现医药供应链服务智能化。三是通过海量医疗数据的分析和共享,科研人员可以更精准地进行疾病分析和新药开发,有效支撑药品研发创新。四是通过构建医疗运营大脑、电子黄牛甄别系统、医疗数据报告、用户画像体系、BI数据平台、数据赋能等六大服务体系,为医院、政府构建医疗数智决策中心。目前,京通健康大数据平台已打造20多个应用场景和100多个模型,服务已覆盖260家医院,实现成本节约20%和效率提升50%。
五是拓展多领域多场景应用,构建可持续发展模式。京通健康大数据平台面向患者、医疗机构、医药企业、保险机构、科研机构以及政府等多种客户类型,根据用户特点和需求可提供多样化的应用场景和服务。如面向医院提供包括单体服务、横向数据对比以及分层服务在内的“医疗运营大脑”服务,面向政府可提供年度订阅、项目定制及增值服务等,具备向全国其他地区医疗行业扩展的潜力和持续性。
案例五
基于数据与能力双轮驱动,构建医疗AI服务新模式
医疗行业关乎国家整体的发展和繁荣,业界普遍认为医疗AI是解决医疗行业当前群众看病难、医生压力大、医院运营成本高、医疗资源管控难等问题的有效手段。当前,医疗AI发展产品部署和应用门槛普遍较高,“医研校企”各方主体参与数据生产、课题研究、模型开发和应用推广缺少一站式平台,导致应用和推广难度大。同时,海量数据汇聚难、医疗健康数据敏感性等因素,也严重阻碍着医疗AI的智能化研发与应用。温州市卫生健康信息中心通过打造MaaS(模型即服务)模式的区域医学AI集成平台,实现“即接即用”,并建立区域集成平台归集全市医疗机构数据,打造高质量数据集,支撑成熟AI产品市场应用及孵化期AI模型训练,解决AI研发与应用中海量数据汇聚使用难、产品应用推广难的问题。
一是依托数据统一通道,推动数据高效完整汇聚。通过数据采集工具——数据高铁,将全市医院业务数据上传至温州市智慧健康云,实现与医院端的准实时、全量数据归集,确保数据完整性和实时性。目前,已接入252家公立医疗机构,包括9家省市属医院、33家区县医院和210家卫生院,涉及全市公立医疗机构检查检验、门诊诊疗、手术记录、出入院小结等数据,总体数据量达20TB,涵盖健康档案数据676万条(个人档案)、诊疗数据66亿条、公卫数据2.96亿条。
图1 数据高铁系统架构图
二是标准化处理与标注,构建高质量数据集。一方面构建MaaS模式数据资源体系,上传的数据在统一的封闭化空间进行清洗、脱敏、标准化等处理,并结合专业化医生的标注形成可训练数据集。另一方面将处理后的数据集进行分类、标签化,提供可靠的数据存储服务,形成安全的可训练数据集,确保数据资源高效复用。同时,利用知识图谱、机器学习等数据分析技术,结合大模型训练,以及实际医疗应用形成基于分场景、分对象的细化服务。
图2 数据标注处理流程图
三是多维度措施保障数据安全。一方面,利用独立数据通道、加密传输、严格访问策略及API数据安全网关,确保敏感数据“授权可访问”、实时监控和审计。另一方面,基于温州市健康大脑安全体系,针对云、网、端、数、应用、行为等多个关键环节,为数据采集、治理、加工、存储、传输等环节提供严密的安全保障。
四是以数据驱动智慧医疗健康服务场景建设。目前已形成智慧影像辅助诊断、智慧检验场景的智能化诊断、智慧病历场景的自动化病历书写,肾病诊疗场景的个性化治疗方案以及个人健康管理服务等多个高价值应用场景,有效助力医疗机构提升诊断能力和工作效能。例如,健康云检集成平台一期形成了涉及人体六大部位冠脉CTA、肺结节、肋骨骨折等12项医学AI辅助诊断能力,累计分析病例检查量超1000万例,单个脑卒中AI病例的脑部CT影像分析时间在使用AI后,可从原来的1小时缩短至5~15分钟;智慧检验场景已对接全市11家三甲医院,每年可覆盖1652万人次,5年期总市场空间可达6580万元;生成式智慧病历帮助医生快速完成病历书写任务,平均书写时间从原来的10分钟下降至30秒,效率提高190%,单份病历成本由30-60元降至5元,成本下浮最高可达90%以上。
图3 温州市医学影像云智脑驾驶舱
图4 智慧检验平台
五是构建多元化多渠道的可持续发展模式。基于MaaS模式的云数据中心平台,可为AI公司、科研团队、商业公司等提供安全、高效、一体化的医学数据训练解决方案,包括标注服务、医学数据服务、算力服务等。同时,基于提供算法训练平台、技术支持、培训等服务,或通过与合作伙伴开展技术研发,分享项目经济收益,确保项目的经济效益和盈利能力。
文章来源:国家数据局官微
更多精彩内容请登录http://www.ciomanage.com官方网站
或扫描下方二维码,点击关注微信公众号(ID:sagetimes)
往/期/经/选
公司介绍
北京赛智时代信息技术咨询有限公司(简称赛智时代)是国内知名的数字经济等新兴产业的咨询规划、大数据分析和产业生态体系建设的创新型公司。业务范围涵盖了智库咨询、数据服务、软件平台以及会议培训等方面。其中智库咨询服务依托于赛智产业研究院丰富的行业资源和高端专业化人才等竞争优势,面向政府、园区和企业,提供发展战略与规划、政策研究、招商引资策略研究、智慧城市规划、运营模式研究等现代咨询服务。研究领域涵盖大数据、人工智能、区块链、5G、战略性新兴产业等行业领域。
饮鹿网(Innov100)是是赛智时代旗下的产业创新创投数据服务平台,覆盖新兴产业近20万创新型企业,为客户提供创业孵化、投融资等服务。
联系方式
电话:16601025121/18701559508
公司网址:www.innov100.com
www.ciomanage.com
公司地址:北京市朝阳区大屯里317号金泉时代广场三单元2216
智库服务
北京市数字经济战略研究
北京市数据要素市场促进服务(北京市新型数据交易规则体系设计)
北京数据先行区关键机制创建服务
贵州省加速构建数据要素市场培育新兴产业课题研究
国家大数据(贵州)综合试验区实施方案
中国数据服务产业图谱研究
内蒙古自治区大数据中心数据要素市场化规划咨询
保定市数据服务产业发展规划编制
朝阳数据要素市场发展研究
丰台区数字经济倍增发展路径研究
北京市大数据立法数据支撑服务
北京市智慧城市建设协调推进项目
中国算力网络发展研究白皮书
重庆两江新区数字经济发展规划
贵阳市大数据五大新领域(人工智能、量子信息、区块链、物联网、5G移动网络)产业规划
南宁市元宇宙产业创新发展研究
贵阳市数字经济产业招商引资项目评估
智能贵州发展规划
贵州省大数据新领域产业发展指南
北京市大数据应用发展报告
天津市大数据应用场景建设计划
贵州省大数据战略行动计划编制
贵州省“十三五”以大数据为引领的电子信息产业发展规划
丽水市城市大脑开发建设研究
贵阳市新基建“十四五”发展规划
中国数谷顶层设计方案
贵阳市数博大道产业规划
贵阳区块链发展白皮书
贵阳市大数据发展“十三五”规划
贵阳市数字经济发展规划
观山湖区呼叫中心产业园规划
济南新型智慧城市规划
南宁大数据建设工程规划
航天科技车联网产业商业模式研究
阿里云数智化敏捷组织:云钉一体驱动组织转型研究
百度区块链研究项目
实创集团智慧城市业务战略规划
云上贵州集团业务战略规划
贵阳大数据集团业务战略规划……
软件平台
饮鹿网精准招商大数据产业平台
饮鹿网精准招商大数据产业平台是赛智产业研究院联合饮鹿网开发的针对产业招商的最新产品。涵盖大数据、人工智能、区块链、5G、智慧城市、 工业互联网等 30 多个领域,为招商部门、产业主管部门、园区管委会和产业地产提供大品牌招商、产业筛选招商、产业生态链招商、重点产品招商、资本注入式招商、区域一体化协同招商、原籍创业人才招商等招商数据分析服务。
饮鹿网产业大脑大数据产业平台
政府提供新兴产业的产业链、企业、技术、投资等数据分析服务的平台,主要为各地发改部门、工信部门、产业分管领导提供产业仪表盘、产业链分析、产业地图、产业发展要素分析、产业政策、产业洞察等产业数据分析服务。
饮鹿网创业投资大数据产业平台
服务于创业投资领域,为母基金、头部投资机构、地方政府产业基金或引导基金提供绩效考核的专业化平台,主要提供投资数据(投融资仪表盘:与投资趋势洞察融合)、投资绩效分析(投资绩效分析、融资日报、投资机构百强、投资人百强)、项目分析(重点项目、产业链投资、细分图谱投资)、投资布局(投资地图)、投资要素分析、投资管理等服务。
热门跟贴