临床试验站点选择,一个价值每天50万美元的决策,现在还在用电子表格做。
这不是夸张。Tufts药物研发中心的数据显示,37%的激活站点未能达到入组目标,11%甚至一个患者都没招到。结果是53%的试验超出计划时间表,六分之一的试验耗时是预期的两倍多。更麻烦的是,这个糟糕的比例二十年来几乎没变。
打开网易新闻 查看精彩图片
Databricks今天开源了一个叫Site Feasibility Workbench的工具,试图解决这个问题。它是个Databricks App,把机器学习驱动的站点评分、运营状态管理和自然语言数据查询,全部塞进了同一个工作空间。没有外部API调用,没有同步管道。
核心思路很直接:临床运营数据和应用不该活在两个系统里。现在的典型架构是数据仓库、CTMS、EDC各自为政,下游再挂个BI层。这些系统之间的对话方式,不支持临床团队实际要做的决策——所以决策被搬到了电子表格里。
这个工具用LightGBM模型,基于你自己的CTMS、EDC和IRT历史数据训练,不是行业平均数。评分随你的项目组合增长而改进,每次预测都附带SHAP驱动的归因解释,以受管的Delta表形式存储。模型理由和分数本身一样,可审计、可版本控制。
Lakebase处理运营状态,AI/BI Genie负责自然语言查询。整个堆栈在一个平台上,消除了集成开销、凭证扩散和同步延迟。
开源的意图很明显:展示当应用、模型和数据住在同一个地方时,临床运营情报应该长什么样。架构变了,结果才可能变。
热门跟贴