打开网易新闻 查看精彩图片

无论是在医药魔方Med公众号,还是DeepMed数据库,“指南”都是大家关注的重点。面对信息的海洋,如何获得真实且适用的证据建议?看完以下5个小问答,或许能更深刻地理解指南的含义。

▌问题1:“指南”和“专家共识”有何区别?

“指南”,多指临床实践指南 (注:另有患者指南,实验室检验指南等) 。1990年, 美国医学科学院(Institute of Medicine,IOM)首次定义了临床实践指南(clinical practice guidelines,CPG)——针对特定的临床情况、系统制订的、帮助医务人员和患者作出恰当处理决定的建议。2011年,随着循证医学的发展,IOM更新了定义——基于系统评价的证据平衡了不同干预措施的利弊,在此基础上形成的能够为患者提供最佳保健服务的推荐意见。虽然包括世界卫生组织(WHO)、英国国家健康与临床优化研究所(NICE)等多个国际组织/学会对指南有不同的定义,但应用范围最广泛的仍然是IOM的定义。

与指南相比,共识则缺乏统一的定义。在医学以外更广泛的层面上,国际标准化组织(ISO)对共识有权威且精准的定义——有关的重要利益相关方对实质性问题没有坚持反对意见,同时按照程序考虑了有关各方的观点并且协调了所有争议。达成共识代表普遍同意,但并不意味着全体共识专家一致同意。

对共识的认识和理解,国内外可能有所差异。国内普遍的一种观点是:医学领域的专家共识是一种质量和影响力低于指南的行业指导文件,指南比共识具有更好的科学性、透明性和可靠性。

图片来自:如何区分临床实践指南与专家共识. 协和医学杂志. 2019. 10(4): 403-408.
打开网易新闻 查看精彩图片
图片来自:如何区分临床实践指南与专家共识. 协和医学杂志. 2019. 10(4): 403-408.

而在国际上,共识更多代表了一种为达成指南中的推荐意见而采纳的方法或途径。理论上,任何指南都需要一个参与专家集体“共识”的过程,因为研究证据无法自动转化为推荐意见,必须基于专家对证据以及影响推荐意见的其他因素的综合评估和判断,最终产生推荐内容。

指南和共识质量的高低,与其制定过程中的透明性和规范性,以及推荐意见的独立性和清晰性有关,而与证据的多少及质量无直接关系。

▌问题2:临床实践指南的基本制订过程是怎样的?

指南的制订方法和步骤也在不断改进。国际指南的制订可参考2014年《世界卫生组织指南制订手册》,国内指南的制订可参考2022年中华医学杂志发表的《中国制订/修订临床诊疗指南的指导原则(2022版)》及人民卫生出版社出版的《循证临床实践指南的制定与实施》。

而对于共识的制订方法和流程,目前尚未形成统一规范,常用的方法主要有:德尔菲法、名义群体法、共识会议法及改良德尔菲法。1、德尔菲法:采用匿名投票,简便易行,但花费时间较长;2、名义群体法:可以面对面进行交流,保证观点的真实性,但话语权较大的参与者可能影响其他人的决策;3、共识会议法:讨论参与人群广泛,利于观点的产生,但过程缺乏透明性;4、改良德尔菲法:综合了德尔菲法和名义群体法,但过程较为复杂,且耗时较多。

各指南制订机构的制订过程相差不大,小编在此综合绘制了一个流程图供参考。

打开网易新闻 查看精彩图片

图:自己画的

首个核心步骤在于构建临床问题。就以NICE确定临床问题的7个步骤为例来具体描述:1、广泛的文献检索;2、了解相关疾病背景;3、确定目标人群和优选关键问题;4、检查与其他NICE指南重叠的内容;5、确认利益相关群体的意见;6、形成草案进行公开咨询;7、协商确定指南范围。

而在指南制订流程中的关键环节是评估证据质量并商议推荐强度。研究人员在创建和推广证据分级标准和推荐意见时,也需要力求统一,尽可能避免偏倚,以减少误导和滥用。医学研究中证据分级和推荐强度也经历了一个不断演进的过程,这就是我们下面两个详细说明的问题了。

▌问题3:为何证据质量和推荐强度分级十分重要?

在卫生保健决策时,医生和患者都必须权衡各种治疗方案的利弊,对预期利弊的最佳估计以及对估计的信心都会影响最终决定。有这么一个例子,既往有推荐临床医生鼓励绝经后妇女使用激素替代疗法,认为可以明显降低绝经后妇女的心血管病风险。如果当时有一个严格的证据质量分级系统,这项证据应该是极低质量,推荐等级也会下降,因为该证据源于一些结果相矛盾的观察性研究。最终随机对照试验(RCT)证明,激素替代疗法非但没有降低、反而可能增加心血管发病风险。对证据质量的认识不足,可能导致指南和推荐不当,从而对患者造成伤害。因此,正确认识证据质量和推荐强度非常重要。

图片来自:GRADE:证据质量和推荐强度分级的共识. 原载于BMJ. 2008; 336: 924-926.
打开网易新闻 查看精彩图片
图片来自:GRADE:证据质量和推荐强度分级的共识. 原载于BMJ. 2008; 336: 924-926.

▌问题4:证据质量和推荐强度是如何确定的?

20世纪60年代,美国两位社会学家首次提出了证据分级概念,将RCT的质量定为最高。随后,有关证据分级和推荐强度不断改进。在下面的表格里,我们可以看到重要的修正。

打开网易新闻 查看精彩图片

图片来自:医学研究中证据分级和推荐强度的演进. 中国循证医学杂志. 2008. 8(2): 127-133.

1979年,加拿大卫生部定期体检工作组(CTFPHE)首次基于试验设计,将证据分为三级,设计良好的RCT级别最高,专家意见级别最低,将推荐强度按照证据级别分为支持和不支持。1992年,美国卫生保健政策研究所(AHCPR,现更名为AHQR)将RCTs的Meta分析作为最高级别的证据。2001年英国正式发表了牛津证据分级与推荐意见强度,首次在证据分级的基础上提出了分类概念,涉及治疗、预防、病因、危害、预后、诊断、经济学分析七个方面,成为循证医学中公认的经典标准。20世纪90年代,循证医学迅速发展,Cochrane协作网的全球参与,标志一个新时代的到来。2004年正式推出了GRADE分级。

GRADE分级的特点是:1、明确定义了证据质量和推荐强度;2、统一使用了级别(grade)代替证据水平(levels of evidence);3、突破了过去主要从研究设计角度考虑证据质量的局限性,综合考虑研究设计、研究质量、研究结果的异质性和证据的直接性;4、从使用者而非研究者角度制定了标准,拓宽了应用范围,并随时更新;5、推荐意见简化为强弱两项。该分级的提出成为证据发展史上的里程碑事件

打开网易新闻 查看精彩图片

图片来自:医学研究中证据分级和推荐强度的演进. 中国循证医学杂志. 2008. 8(2): 127-133.

打开网易新闻 查看精彩图片

图:大家都非常熟悉的证据等级金字塔,2001年由美国纽约州立大学下州医学中心推出。

推荐意见强度(以GRADE为例)的核心点始终是权衡利弊,理想结果和不理想结果之间的差异越大,就越有可能做出强推荐;净收益越小、收益的确定性越低,则越有可能做出弱推荐。此外证据质量、价值观/偏好、资源利用也都是考虑因素。在制定推荐强度时,利弊也是相对的、会变化的,难免会有一定的主观性,但是大多数指南制订组认为,制定出明确的推荐意见分级标准的价值远大于其不足。

GRADE分级已经被广泛采纳,包括WHO、美国内科医师协会、UpToDate、Cochrane协作网、中华医学会等。部分指南制定机构推荐采用GRADE的同时对其进行了调整改编。例如:美国临床肿瘤学会(ASCO)采用改编自AHRQ、美国预防服务工作小组(USPSTF)和GRADE的标准。

图片来自:原发性肝癌诊疗指南(2022年版)
打开网易新闻 查看精彩图片
图片来自:原发性肝癌诊疗指南(2022年版)

▌问题5:如何看待不同指南中推荐意见的差异?

指南制订流程方面,各个国家/地区差别并不大。但是,不同的国家/地区,疾病流行病学特征、卫生医疗系统的水平、临床研究证据的质量、药物经济学、指南更新频率等,都是造成指南推荐意见之间存在差异的因素,核心因素还是新证据的出现

而对于非医学专业者,建议优先考虑来自权威组织/学会的指南,对比多个指南,更全面的了解问题和可能的解决方案,并咨询相关领域专家的意见,评估这些推荐意见的适用性,同时持续关注最新公布的临床研究数据和指南更新信息。‍‍‍‍

参考文献

1、如何区分临床实践指南与专家共识. 协和医学杂志. 2019. 10(4): 403-408.

2、医学研究中证据分级和推荐强度的演进. 中国循证医学杂志. 2008. 8(2): 127-133.

3、GRADE:证据质量和推荐强度分级的共识. 原载于BMJ. 2008; 336: 924-926.

4、国内外制订临床指南的循证评价. 中国循证医学杂志. 2016; 16(11):1322-1330.

Copyright © 2023 PHARMCUBE. All Rights Reserved.

欢迎转发分享及合理引用,引用时请在显要位置标明文章来源; 如需转载,请给微信公众号后台留言或发送消息,并注明公众号名称及ID。

免责申明:本微信文章中的信息仅供一般参考之用,不可直接作为决策内容,医药魔方不对任何主体因使用本文内容而导致的任何损失承担责任。