临床试验站点招募不达标,这个困扰行业二十年的老问题,真的只是因为工具不够好?Databricks最新开源的Site Feasibility Workbench给出了不同答案——问题出在架构,而非功能。
Tufts药物开发研究中心的数据显示,37%的激活站点未能达到招募目标,11%甚至零招募。综合结果是53%的试验超出计划时间,六分之一的试验耗时是预期的两倍以上。每天高达50万美元的潜在药品销售收入损失,加上4万美元的直接试验成本,站点表现不佳已成为药物开发中最昂贵的成本驱动因素之一。更棘手的是,这一比例二十年来几乎没有改善。
症结在于数据孤岛。多数药企已有数据仓库、CTMS(临床试验管理系统)、EDC(电子数据采集系统)和BI层,但这些系统彼此割裂。临床运营团队被迫在电子表格中做决策,导致集成开销、凭证泛滥和同步滞后,最终侵蚀对数据的信任。
Site Feasibility Workbench尝试打破这一困局。这是一款完全开源的Databricks应用,将试验站点选择全流程跑在Databricks工作空间内——ML驱动的站点评分、Lakebase运营状态管理、AI/BI Genie自然语言数据访问,全程无需外部API调用或同步管道。
其核心设计在于"同平台共存"。应用、模型和数据不再分散,LightGBM模型直接基于企业自身的CTMS、EDC和IRT历史数据训练,而非行业平均值。随着项目组合增长,模型表现持续提升。每次预测的SHAP归因解释作为受控、版本化的Delta表存储,使模型推理逻辑与评分本身同样可审计、可追踪。
这不仅是工具替换,而是架构重构——从"连接现有系统"转向"决策支持应用与临床数据零集成栈"。当数据血缘、模型版本和运营状态统一在Lakehouse治理框架下,电子表格里的灰色决策才有被系统性替代的可能。
热门跟贴