临床终点对于评估新癌症疗法的安全性和有效性至关重要。肿瘤学家使用它们来帮助指导临床决策。虽然总生存期 (OS) 通常被视为“金标准”主要临床终点,但其实用性受到一些缺点的限制。使用 OS 进行的试验非常耗时,因此最近推动了对替代临床终点及其替代 OS 作为主要临床终点的潜力的推动。此外,随着其他终点在肿瘤临床试验中的使用变得越来越普遍,越来越明显的是,其他终点增加了有关生活质量和治疗失败的有价值的信息。毫无疑问,随着新的癌症疗法的开发以及包括免疫疗法在内的新疗法的扩展,临床终点的使用将继续扩大和发展。
本文总结了主要和替代临床终点的作用,以及每个特定终点的优点和缺点。
在肿瘤患者的治疗中,也经常听提到 CR、PR、SD、PD 等一些术语,有些患者并不明白,这些术语都是肿瘤临床疗效评价中常见的指标,对于肿瘤治疗的评估至关重要,这些术语到底是什么含义?本文通过表格简单汇总,详细内容见下表 1。
表1不同临床终点的比较
肿瘤治疗指标:客观缓解率(ORR)、疾病控制率(DCR)、无进展生存期(PFS)和总生存期(OS),分为近期疗效治疗和远期疗效指标,近期疗效指标主要评估药物对肿瘤的直接影响(包括导致肿瘤消失或退缩等),其中以 ORR 最为关键,而远期疗效指标主要评估药物对患者生存时间的影响,以 OS 最为关键。准确评估患者肿瘤的治疗情况,对患者的后续治疗意义重大。图 1简要地说明了主要的临床终点在时间尺度上与假设肿瘤大小的关系。
图1简要说明各种终点在时间尺度上与假设肿瘤大小的关系。
下面详细介绍各种肿瘤临床终点:
临床试验对于医疗干预措施的发展至关重要,因为它们评估每种新方法的安全性和有效性。临床终点是一种客观工具,用于衡量医疗干预对患者感觉、功能和生存的益处。临床试验中使用临床终点来评估研究的有效性和普遍性,它们产生的证据对临床医生和患者都很重要。临床终点还能够评估使用医疗干预的结果来指导临床决策。在为患者提供潜在的治疗选择时,医生会寻找能够提高生存率、减轻症状、恢复功能能力或降低患慢性病的机会的干预措施。这些理想的效果会与任何负面副作用或假设的风险进行权衡。
由于医疗干预可能对患者产生多种影响,因此使用多个终点来评估干预导致的临床病程变化非常重要。此外,使用多个终点可以让团队评估独立于干预而产生的结果或通过干预而改变的结果。此外,非临床终点(例如生物标志物)经常被用作生物过程的客观测量。
良好的主要临床终点应具备许多品质。终点应该易于临床医生、观察者或患者客观或主观地测量。最重要的是,主要临床终点应该与患者具有临床相关性,并直接衡量患者的感受、执行日常任务的能力或生存率。由于选择错误的终点可能会导致难以检测研究结果,因此许多试验使用了许多可能具有主要或次要意义的终点。
临床试验也经常依赖于使用替代终点来替代临床终点。在替代终点的经典定义中,它们被称为“生物标志物”,然而,并非所有生物标志物都符合替代终点的标准。为了使生物标志物被视为替代终点,生物标志物与临床结果之间必须存在关系;仅仅生物标志物与疾病的病理生理学之间的关联是不够的。如果有关疾病病理生理学和干预措施作用机制的一般信息,替代终点有望预测临床益处或危害。虽然替代终点历来被用来快速评估临床试验中的医疗干预措施,但它们没有严格的验证标准。
根据结果的测量方式,临床终点也可以分为定量或定性。定量终点是通过从随机化或治疗开始到期望事件所经过的时间来客观测量的。相比之下,定性终点是主观测量的,通常根据患者、护理人员或医生的观察结果进行报告。新型癌症治疗方法的开发尤其依赖于临床试验和相关临床终点的利用。在肿瘤患者的试验中,考虑不同的肿瘤类型、组织学亚组和预期寿命也很重要。例如,虽然传统上保留临床终点来评估 III 期临床试验期间的治疗,但随着新型免疫疗法的发展,它们在早期临床试验中的使用变得更加频繁。
总体生存率
总生存期(OS,Overall survival)定义为从随机分组到死亡的时间。任何失访或在评估时仍然活着的患者都会被审查。由于癌症治疗的目标通常是延长生存期,因此 OS 通常被称为肿瘤学临床试验中的金标准终点。OS 是一个以患者为中心的终点,易于测量;它是确定的,因为最终时间点是死亡。而且,OS是客观的,不太可能发生研究者偏见。
虽然 OS 仍然是肿瘤学临床试验中的首选临床终点,但它也有一些缺点。首先,长期患者随访的预期表明需要更多的患者群体,并且该研究将需要更多的财政支持。此外,OS 在进展缓慢且预期长期生存的疾病中的使用有限。在这些情况下,OS 可能会受到后续治疗、其他药物的连续使用以及交叉治疗的影响,因此很难将临床终点归因于特定的医疗干预。此外,作为主要临床终点,OS 也可能受到非癌症死亡的影响,因为终点定义为从随机分组到任何原因死亡的时间。
无进展生存期
无进展生存期(PFS,Progression free survival)定义为从随机分组到首次出现疾病进展或死亡证据的时间。PFS 通过审查和评估时仍存活的患者或失访的患者来测量。PFS 是一种流行的替代终点,因为需要更少的患者来获得试验早期可用的数据。这些因素通常会导致临床试验提前完成并降低相关成本。PFS 还提供了客观评估的好处,而不受后续治疗或交叉的影响。PFS 是临床终点的一个有吸引力的选择,因为它提供有关药物活性的直接信息以及与 OS 相比数据的快速周转。此外,PFS 作为临床终点因其评估包括多阶段治疗在内的治疗范例的能力而受到更多关注。当 OS 无法评估每轮治疗的短期增量变化时,PFS 可以。然而,将 PFS 作为临床终点存在争议,因为延长 PFS 并不总能延长生存期。
进展时间
进展时间(TTP,Time to progression)定义为从随机分组到首次出现疾病进展证据的时间。由于 PFS 和 TTP 相似,因此研究阐明疾病进展证据的含义非常重要。在晚期乳腺癌中,一些研究人员交替使用 PFS 和 TTP,这在比较各种试验的结果时可能会导致混乱。与此同时,研究已使用 TTP 来评估晚期非小细胞肺癌的积极治疗,然而,其作为替代标志物的使用尚不明确,应避免将其作为主要终点。TTP 评估的价值可能会受到每位患者独特的疾病特征的不利影响,包括肿瘤间变异和肿瘤的自然生长速率。对此,研究人员提出了患者个体化的“TTP比率”作为衡量靶向治疗有效性的附加参数。TTP 的这种变体比较了治疗期间和治疗结束时的肿瘤生长,作为自然肿瘤生长率的患者体内对照。
无病生存期
无病生存期(DFS,Disease free survival )定义为从随机分组到出现疾病复发证据的时间。它与反应持续时间(DOR)密切相关:肿瘤对治疗有反应而不生长或转移的时间长度。PFS 被用作治疗更晚期、转移性恶性肿瘤的临床终点,而 DFS 被用作根治性手术或放疗后辅助治疗的临床终点。与 PFS 类似,DFS 是一个替代终点,与 OS 等其他终点相比,它需要更少的患者数量和更短的随访时间。因此,DFS 通常被视为 OS 延长的癌症的重要终点。由于多种原因,该领域的专家对 DFS 的价值存在争议。首先,“无病间隔期”的定义容易引起疑问。此外,无论此类患者的症状如何,偶然发现癌症的有效性问题仍然存在争议。由于这些原因,在使用 DFS 作为临床终点时定义复发变得越来越重要。尽管有其缺点,DFS 已在 III 期结肠癌、肺癌和乳腺癌的辅助治疗临床试验中用作 OS 的有力替代终点。
无事件生存期
无事件生存期(EFS,Event-free survival)定义为从随机分组到发生事件的时间,事件可能包括疾病进展、因任何原因停止治疗或死亡。虽然 EFS 和 DFS 过去可以互换,但严格来说,在新辅助治疗中随机分组时患者并非“无病”;EFS 现在是为新辅助治疗保留的临床终点,而 DFS 则应用于辅助治疗。EFS 是一个替代终点,可以用来代替主要终点(例如 OS),以减少样本量、成本和随访时间 。由于 EFS 是替代终点,因此需要针对每种独特的肿瘤类型、治疗和疾病阶段对其进行验证。急性髓系白血病 (AML) 的研究已用于评估 EFS 作为替代终点的强度。在 AML 病例中,使用 EFS 而非 OS 的好处之一是,它不依赖于未能达到缓解或病情复发后所给予的治疗;这意味着 EFS 在治疗期间可以更直接地评估基于治疗的益处。
治疗失败时间
在肿瘤学临床试验中,治疗失败时间(TTF, time-to-treatment failure)是指从开始化疗/干预到提前停止的时间。过早停止治疗的原因可能包括癌症进展,也可能包括不良事件、患者选择或死亡。与其他临床终点不同,TTF 经常用于监管药物审批,因为它不直接衡量治疗效果。当 TTF 用作主要终点时,会策略性地选择次要终点,以探讨与其他原因相比因疾病进展而停止化疗的患者比例。使用 TTF 作为临床终点时,考虑参加试验的患者的年龄也很重要。老年患者在临床试验中出现不良事件的几率更高;这种差异可能会因不良事件而影响 TTF,在研究设计期间应予以考虑。当与 OS 一起使用时,TTF 可以成为一个有效的终点,为生存条件下提供安全性补充,这是治疗评估的“黄金标准”。
到下次治疗的时间
下次治疗时间(TTNT,Time to next treatment)定义为从开始治疗到开始下一行治疗的时间。对于一些无法治愈的疾病,TTNT 对于需要许多治疗干预来延长生存期的患者来说是一个有意义的终点。与大多数疾病相关终点不同,TTNT 包括治疗耐受性和患者依从性的时间。TTNT 继续作为治疗疗效持续时间的衡量标准,特别是在原发性皮肤 T 细胞淋巴瘤中。尽管 TTNT 很有用,但它是临床获益持续时间的替代标志物,在作为评估治疗效果的独立标志物之前需要进行验证。
临床获益的持续时间
临床获益持续时间(DoCB,Duration of clinical benefit)定义为患者获得完全缓解、部分缓解或疾病稳定24周或更长时间从随机分组到疾病进展或死亡的时间。它是临床试验中使用的主要终点,其中疾病稳定以延长生存期是主要目标。
反应持续时间
反应持续时间(DoR,Duration of response)定义为从随机分组到达到完全或部分缓解的患者疾病进展或死亡的时间。它与 DFS 密切相关,衡量患者在没有肿瘤生长或转移的情况下对治疗有反应的时间。DoR 可用于评估持久反应和延缓疾病进展的治疗,而不是提供暂时缓解但没有持久益处的治疗。
客观反应率
客观缓解率(ORR,Objective response rate)是衡量特定治疗如何影响有实体瘤病史的患者的肿瘤负荷的指标。它被定义为对治疗部分反应(PR)或完全反应(CR)的患者比例。ORR是抗肿瘤活性的一个很好的衡量标准,过去有许多不同的评估标准用于评估ORR。世界卫生组织 (WHO) 率先制定了评估癌症治疗临床试验中 ORR 的标准。ORR 主要通过不同解剖成像方式发现的肿瘤大小和总肿瘤负荷进行评估。尽管世界卫生组织的标准受到了近二十年的青睐,但因其病变数量和可测量目标的选择的观察者间差异而失宠。它被实体瘤疗效评估标准 (RECIST) 所取代,该标准自最初设计以来也经历了修改。在最新版本中,RECIST 按大小选择目标病灶,并将其定义为所有相关器官的代表性病灶。每个器官最多 2 个病灶,总共 5 个病灶被视为基线目标病灶,而所有其他病灶均为非目标病灶。RECIST 还可用于评估 PFS,并将疾病进展定义为最多 5 个目标病变直径总和相对于获得的最小总和增加 20%。使用 RECIST 使 ORR 成为多个临床试验地点的标准临床终点,但是,当谈到 ORR 作为临床终点的有用性时,仍然存在一些担忧。首先,ORR 无法捕获疾病稳定的患者,并且无法区分完全缓解的患者和部分缓解的患者。虽然从 WHO 标准过渡到 RECIST 标准有助于消除一些观察者间的差异,但它并不能完全消除通过 CT 或 MRI 方式测量肿瘤时经常引入的人为错误。此外,仍然存在一个基本问题:尽管肿瘤消退,ORR 确实充分反映了 PFS、DFS 和 OS 等终点。目前,ORR 在评估新辅助疗法的试验中提供了最大的实用性,尤其是乳腺癌患者的新辅助疗法。
完全缓解
完全缓解(CR,Complete response)被定义为缺乏可检测到的肿瘤证据。影像学研究和组织病理学用于测量 CR,根据具体疾病或使用环境,可以将其用作替代或主要终点。例如:多发性骨髓瘤治疗中的 CR 已被证明具有临床相关性,因为它在特定治疗研究中传达了与改善 OS 和延长 EFS 相关的生存优势。
病理完全缓解
病理完全缓解(pCR,Pathologic complete response)最常被用作乳腺癌的替代标志物,被定义为在评估切除的乳腺组织和区域淋巴结后不存在残留的浸润性癌症。该临床终点通常用于 FDA 加速批准计划下的乳腺癌患者新辅助化疗试验。在对乳腺癌新辅助化疗后患者进行的研究中,达到 pCR 的患者与 OS 和 EFS 的改善相关。
疾病控制率
疾病控制率(DCR,Disease control rate)描述了治疗干预已导致完全缓解、部分缓解或疾病稳定的晚期癌症患者的百分比。DCR 与 ORR 相关,在评估具有主要抑瘤作用而不是杀肿瘤作用的癌症治疗方面具有最大的实用性。例如,在 II 期临床试验中发现 DCR 可以预测广泛期小细胞肺癌的后续生存率。然而,在 II 期临床试验中使用 DCR 并不能深入了解患者可能从该疗法中获得的临床益处。此外,一些人认为 DCR 可能提供不明确的信息,并可能夸大该疗法的抗癌效果。
临床受益率
临床获益率(CBR,Clinical benefit rate)定义为因治疗而达到完全缓解、部分缓解或至少六个月疾病稳定的晚期癌症患者的百分比。有人认为根本不应该使用 CBR,因为它不能衡量临床效益。它的使用也得到了支持,因为与 DCR 一样,CBR 可用于快速评估抗癌活性,并可进一步捕获疾病稳定性。
与健康相关的生活质量
健康相关生活质量 (HRQoL,Health-related quality of life) 是一项由患者报告并证明临床益处的重要指标。它是对患者随时间的健康状况的生活质量的评估。将 HRQoL 纳入临床终点的目标是完成 OS 等结果定量终点。生活质量通常被用作次要临床终点,以比较具有相似效果和毒性差异的治疗方法,但它也可以用作 OS 的共同主要终点。HRQoL 通常使用疾病控制和预防中心 (CDC) 制定的一组四个核心问题进行评估。四个核心问题包括与整体健康、身体健康、心理健康和日常生活活动相关的概念。这项调查的项目很简短,提供的结果易于评估者解释。
里程碑生存
里程碑生存(Milestone survival)被定义为给定时间点的生存概率。它被归类为与 OS 相关的终点,但是,它被认为是定性终点,描述特定时间点的横截面评估,并且不考虑所有 OS 数据。里程碑生存仍然是后期药物开发中 OS 的可能替代终点,与用于评估癌症免疫学进展的其他终点类似,需要进一步验证。
总结与展望
随着靶向治疗的发展,癌症药物评估中主要临床终点的使用发生了变化。FDA 最初在 20 世纪 70 年代使用 ORR 来批准癌症药物,依靠影像学研究和身体评估来衡量结果。直到 1980 年代,肿瘤药物咨询委员会 (ODAC) 和 FDA 才认识到生存率、生活质量、身体功能和肿瘤相关症状的改善并不总是与 ORR 相关。事实证明,OS 是衡量肿瘤学试验中直接临床获益的优越临床终点。尽管有这一发现,ORR 仍然是正在考虑加速批准的癌症药物的常见替代临床终点。在针对难治性肿瘤且目前没有治疗选择的患者的单臂试验中,还特别考虑了 ORR 作为主要临床终点。1990 年至 1999 年间,30% 的 FDA 批准的抗癌药物试验将OS作为主要临床终点。2006 年至 2011 年间,这一数字下降至临床试验的 14.5%。随着使用 OS 作为主要终点的临床试验数量减少,PFS 和 DFS 等终点的使用变得更加频繁。财务和时间限制继续促进这一转变,因为与替代终点(分别包括转移性癌症的 PFS 和治愈性癌症的 DFS)相比,OS 需要对更多患者进行更长时间的试验。2005年至2013年,美国批准的八种实体瘤辅助或治疗药物中有五种将DFS用作主要终点。DFS 在辅助治疗中作为主要临床终点的使用得到了以下事实的支持:大部分患者在疾病复发时会出现癌症症状。FDA 现在认识到 DFS 和 PFS 的临床益处,并允许将其用作寻求监管部门批准的试验的主要终点。在 FDA 最近的一项声明中(法规 21CFR813),PFS 和其他替代终点可用于加速批准针对严重或危及生命的疾病的药物。
虽然延长生存期是癌症治疗的主要目标,但支持 OS 的其他临床终点的价值也越来越明显。为患者的生活增加更多充实的时间应该是癌症治疗的长期目标,包括 TTP、DCR、CBR 和 HRQoL 在内的测量可以让医生更多地了解患者的额外生命可能会是什么样子。慢性病管理的一部分包括心理健康支持,而可以告诉患者对其疾病状态的预期的临床试验尤其重要。此外,随着人们对免疫肿瘤学的兴趣日益浓厚,需要从 MTD 和 MinED 的早期试验开始探索新的终点。这些与后期试验中的里程碑生存相结合,将使研究人员能够评估新型免疫疗法的非线性剂量反应和剂量毒性动力学特征。
终点不仅会随着新疗法的开发而不断发展,还会随着当前成像和检测模式的定义而不断发展。随着 RECIST 标准取代 WHO 标准的制定,这一转变已经得到证实。随着临床医生越来越擅长识别和分类肿瘤,曾经被标记为稳定疾病的患者将来可能会被发现患有微转移。虽然当前的终点可能会捕捉到成像方面的未来变化,但有些终点可能会开始失宠,而另一些终点则会增加使用以安全地加速药物审批。随着针对特定类型癌症和特定疗法的更多终点不断开发,研究明确定义他们正在使用的终点并能够将它们与其他终点区分开来非常重要。例如,区分 EFS 和 PFS 在很大程度上取决于将死亡记录为与其他不良结果不同的事件。此外,对于参与研究设计的人员来说,熟悉术语的差异也很重要。虽然相关终点(CBR 和 DCR;EFS 和 DFS;CR 和 pCR)之间的差异可能看起来很微妙,但它们对于理解研究中评估的内容至关重要,并且每个终点都特定于治疗或癌症类型。
参考文献:PMC8085844IF: 3.6Q2
感谢点赞,及转发分享的朋友。
热门跟贴