确证性临床试验的研究目的是确证有效性和安全性,为支持注册提供获益-风险关系评价基础,同时确定剂量与效应的关系。确证性试验中,关键假设通常需要预先定义,应能直接反映试验的主要目的,且在试验完成后得到检验。

平行对照设计是最常见的确证性临床试验设计。一般情况下,目标受试者通过随机分配至试验组或对照组,经此过程在治疗组间平衡了各种已知或未知的对疗效有影响的因素,可以认为治疗组间的比较,反映了试验治疗与对照治疗的差异。

与所有试验设计一样,平行对照设计的基本思路也可以大致分为四步:

  1. 根据待解决的临床问题,确定试验目的;

  2. 根据试验目的完成试验设计;

  3. 根据试验目的和试验设计给出相应的统计假设;

  4. 先假设后检验,针对预设的统计假设,对试验结果进行统计检验;

根据统计假设和检验的不同,可以分为优效、等效、或非劣效试验。

优效试验设计

当前期数据或临床实践总结,预期试验治疗的结果更好时,试验目的是确证试验治疗的有效性或安全性优于对照产品(标准治疗方案或安慰剂),即试验治疗的结果相对对照有明显的提高或改善(本文仅讨论高优,即疗效结果越大越好的情况,下同)。

试验设计采用优效性假设:

  • 无效假设H0:试验治疗-对照治疗≤Δ

  • 备择假设H1:试验治疗-对照治疗>Δ

Δ为预先设定的优效界值,可以理解为至少达到此差异则认为有临床实际意义。

对试验结果进行优效性检验,即检验试验治疗的有效性或安全性优于对照产品(标准治疗方案或安慰剂),且其差异大于预先设定的优效界值Δ。一般第Ⅰ类错误水平为双侧0.05,检验时即考察试验治疗与对照治疗疗效差异的95%置信区间下限是否大于优效界值Δ,例如,图一所示,黑色线段代表试验组对照组疗效结果差异的95%置信区间,从下至上为情况一至情况五,代表几种典型的结果。其中仅情况五满足95%置信区间下限大于Δ,即观察到情况五的结果则优效检验成功。特别的,当优效界值Δ=0,即常见的差异性检验;情况四和情况五都满足95%置信区间下限大于0 ,可以判断为优效检验成功。

(图一)

差异指标的类型由主要终点的变量类型决定,当主要终点为类似客观缓解率(ORR)、病理性完全缓解(pCR)这样的率值时,评价组间差异可以使用率差或率比;当主要终点为类似体重、血糖这样的连续变量时,评价组间差异一般使用均值差;当主要终点为无进展生存期(PFS)、总生存期(OS)这样的生存终点时,评价组间差异一般使用风险比(HR)值。

经典案例

以CAMEL-sq研究为例,目标人群为晚期或转移性鳞状非小细胞肺癌(NSCLC)未经治受试者,随机分配至试验组接受卡瑞利珠单抗+化疗治疗或对照组接受安慰剂+化疗治疗;主要终点为PFS,评价卡瑞利珠单抗 VS 安慰剂的PFS的HR情况:

  • 无效假设H0:卡瑞利珠单抗 VS 安慰剂的HR≥1

  • 备择假设H1:卡瑞利珠单抗 VS 安慰剂的HR<1

试验设计时,根据背景资料,预期卡瑞利珠单抗相对安慰剂的HR为0.68;设计相当于优效界值Δ=0的差异性检验,第Ⅰ类错误水平为双侧0.05,即要求卡瑞利珠单抗 VS 安慰剂PFS的HR的95%置信区间上限小于1;试验结果PFS的HR=0.37; 95% CI, 【0.29,0.47】由于0.47<1,优效检验成立,试验成功。

等效试验设计

当并不追求找到试验治疗与对照治疗的差异,前期数据或临床实践总结,预期试验治疗与对照治疗的结果一致时,试验目的是确证试验治疗的有效性/安全性与对照产品等同,即试验治疗的结果相对对照既不更好也不更差。

试验设计采用等效假设:

  • 无效假设H0:试验治疗≠对照治疗

  • 备择假设H1:-Δ<试验治疗-对照治疗<Δ

Δ为预先设定的等效界值,可以理解为差异在(- Δ , Δ )区间内则认为临床上可接受。

对试验结果进行等效检验,即检验试验产品的有效性或安全性与对照产品等同,即差异不超过预先设定的界值区间(- Δ , Δ )。一般第Ⅰ类错误水平为双侧0.05,检验即要求试验治疗与对照治疗疗效差异的95%置信区间下限大于-Δ,且95%置信区间上限小于Δ,例如,图一中仅情况二满足此条件,即试验结果类似情况二时,等效检验成功。

经典案例

以酒石酸唑吡坦片人体生物等效性研究为例,该研究在健康受试者中开展,随机分配至试验组接受酒石酸唑吡坦片或对照组接受思诺思®;主要终点包括Cmax、 AUC0-t、AUC0-∞。

评价试验药 VS 已上市药的生物等效性,以Cmax为例:

  • 无效假设H0:试验药 VS 已上市药的Cmax比值<0.8 或 >1.25

    备择假设H1:0.8<试验药 VS 已上市药的Cmax比值<1.25

第Ⅰ类错误水平为双侧0.05,即要求试验药 VS 已上市药的Cmax比值的95%置信区间下限大于0.8,上限小于1.25;若试验结果Cmax比值=0.99; 95% CI, 【0.85,1.16】由于0.8<0.85,且1.16<1.25,则等效性成立,研究成功。

非劣效效试验设计

当前期数据或临床实践总结,预期试验治疗与对照治疗的结果基本一致,试验目的是确证试验治疗的有效性/安全性非劣于对照产品,即试验治疗的结果不会差于对照治疗。

试验设计采用非劣效假设:

  • 无效假设H0:试验治疗-对照治疗≤-Δ

  • 备择假设H1:试验治疗-对照治疗>-Δ

Δ为预先设定的非劣效界值,可以理解为差异大于- Δ ,则认为差异在临床可接受范围内。

一般第Ⅰ类错误水平为双侧0.05,检验即要求试验治疗与对照治疗疗效差异的95%置信区间下限大于-Δ,例如,图一中情况二至情况五都满足此条件,即试验结果类似情况二至五时,非劣效检验成功;但一般情况下,成功的结果更可能类似情况三。

经典案例

以阿莫西林(Moxatag)注册临床试验为例,目标人群为链球菌感染的咽炎或扁桃体炎受试者,随机分配至试验组接受阿莫西林治疗,或对照组接受盘尼西林治疗;主要终点为细菌清除率,预期阿莫西林的细菌清除率不会差于盘尼西林。

比较的终点为两组间的细菌清除率差,非劣效界值为10%:

  • 无效假设H0:阿莫西林 VS 盘尼西林的率差≤-10%

  • 备择假设H1:阿莫西林 VS 盘尼西林的率差>-10%

第Ⅰ类错误水平为双侧0.05,即要求阿莫西林 VS 盘尼西林的细菌清除率差的95%置信区间下限大于-10%。试验结果率差=1.6%; 95% CI, 【-5.1% ,8.2%】由于-5.1%>-10%,非劣效成立,试验成功。

优效、等效、非劣效试验设计的比较

如上文所述,图一中,类似情况二至五时非劣效成立,情况四、五时优效成立,仅情况二时等效成立,且比较各检验条件,非劣效试验最宽松,优效次之,等效试验最严格;那么是不是三种试验设计中非劣效试验最容易,等效试验最困难呢?另一方面,如果总结既往试验的情况,会发现三种试验样本量的情况一般是非劣效试验最大,优效次之,等效试验最少。

为什么会有这种看似矛盾的结果?举个例子,假如某年统计全国医院的情况,门诊病人的死亡率为万分之几,住院病人的死亡率为千分之几,而ICU病人的死亡率为百分之几;那么难道能根据这一数据判断门诊对病人最好,住院次之,而ICU最差吗?事实上,我们都知道造成这一结果的原因是病人病情的不同——最严重紧急的病人才接受ICU治疗。

同样的,在临床试验设计中,也是根据试验目的确定试验设计;并且每个试验的相关信息不变的情况下,不会出现从非劣效设计改为优效设计,样本量就相应的减少的情况。从试验设计的角度,三种设计是不分优劣的。

非劣效向优效转化,反之则不可

对同一个终点,非劣效检验成功是优效检验成功的必要条件,即优效成功包含在非劣效成功之中;可以在非劣效检验之后序贯优效检验,而不会引起第Ⅰ类错误膨胀。如图二所示,首先检验非劣效是否成功,若不成功则停止检验;若成功,可以继续检验优效假设是否成立。与之相对,当然也可以首先检验优效是否成立,若不成功则停止检验;而若成功,由于非劣效检验成功是优效检验成功的必要条件,此时非劣效检验必定成功,没有检验的必要。从结果上看,若首先计划非劣效检验,当非劣效成功时,可以继续进行优效检验;反之则不可,即若首先计划优效检验,当优效检验未成功时,不能再进行非劣效检验;通俗的说,不能在优效失败后再尝试退回到非劣效。

图二

经典案例

以仑伐替尼(Lenvatinib)Ⅲ期研究为例,目标人群为不可切除的肝癌受试者,随机分配至试验组接受仑伐替尼治疗,或对照组接受索拉非尼(sorafenib)治疗;主要终点为OS。

预期仑伐替尼相对索拉非尼的OS结果不会更差,比较的终点为两组间OS的HR,非劣效界值为1.08:

  • 无效假设H0:仑伐替尼 VS 索拉非尼OS的HR≥1.08

  • 备择假设H1:仑伐替尼 VS 索拉非尼OS的HR<1.08

第Ⅰ类错误水平为双侧0.05,即要求仑伐替尼 VS 索拉非尼OS的HR的95%置信区间上限小于1.08;当且仅当非劣效检验成功时,继续对仑伐替尼 VS 索拉非尼OS的优效检验。

试验结果OS的HR=0.92; 95% CI, 【0.79 ,1.06】由于1.06<1.08,非劣效成立;继续进行优效检验,由于1.06>1,优效不成立。

小结

综上所述,试验目的及其相应的各种背景、条件决定了试验设计的选择,也造成了非劣效研究一般样本量比较大的现实,但单纯改变检验类型即不合适也不会解决样本量大小的问题;预先计划下,非劣效成功后试验可以向优效转化,但优效失败后不可以退回到非劣效。总之,确证性试验采用优效、等效还是非劣效,需要从试验目的出发进行科学、合理设计。

参考文献:

1、ICH E9: 临床试验的统计学原则,FDA

2、药物临床试验非劣效设计指导原则,CDE