37%的临床试验站点不达标，问题出在架构上

字节漫游指南

2026-05-14 07:35 ·北京

临床试验站点选择，一个价值每天50万美元的决策，现在还在用电子表格做。

这不是夸张。Tufts药物研发中心的数据显示，37%的激活站点未能达到入组目标，11%甚至一个患者都没招到。结果是53%的试验超出计划时间表，六分之一的试验耗时是预期的两倍多。更麻烦的是，这个糟糕的比例二十年来几乎没变。

Databricks今天开源了一个叫Site Feasibility Workbench的工具，试图解决这个问题。它是个Databricks App，把机器学习驱动的站点评分、运营状态管理和自然语言数据查询，全部塞进了同一个工作空间。没有外部API调用，没有同步管道。

核心思路很直接：临床运营数据和应用不该活在两个系统里。现在的典型架构是数据仓库、CTMS、EDC各自为政，下游再挂个BI层。这些系统之间的对话方式，不支持临床团队实际要做的决策——所以决策被搬到了电子表格里。

这个工具用LightGBM模型，基于你自己的CTMS、EDC和IRT历史数据训练，不是行业平均数。评分随你的项目组合增长而改进，每次预测都附带SHAP驱动的归因解释，以受管的Delta表形式存储。模型理由和分数本身一样，可审计、可版本控制。

Lakebase处理运营状态，AI/BI Genie负责自然语言查询。整个堆栈在一个平台上，消除了集成开销、凭证扩散和同步延迟。

开源的意图很明显：展示当应用、模型和数据住在同一个地方时，临床运营情报应该长什么样。架构变了，结果才可能变。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴