医疗AI用强化学习做决策,听起来很酷,实际踩坑无数。
核心矛盾:算法在模拟环境里表现再好,一碰真实病历数据就翻车。观测数据不是实验数据,患者没被随机分组,混杂因素多到爆炸。
打开网易新闻 查看精彩图片
三类评估方法各有利弊。重要性采样简单,但方差大;模型化方法假设多,错一个全错;双重稳健试图折中,实现门槛高。没有银弹。
最头疼的是离策略评估(Off-policy)。新策略没上线,怎么知道效果?医疗场景又不能随便试错。现有方法要么偏倚大,要么算不动大规模数据。
作者提了条务实路径:先小样本验证,再逐步放大;同时盯紧置信区间,别被点估计骗了。医疗AI的落地速度,很大程度上卡在这步。
热门跟贴