近年来,因使用误用细胞系导致论文被撤稿的事件屡见不鲜。据统计,大约六分之一研究人类细胞的科研人员时使用了错误的细胞系,3 万余篇的研究论文因细胞系的错认而纷纷阵亡,轻则影响个人和机构的学术声誉,重则对相关学术领域发展造成不良引导与恶劣影响,极大地浪费人们的时间与金钱,严重阻碍疾病的攻克和新药的开发进程。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

来源:PLOS one

以上图所示的论文为例,在发表 8 年以后,被编辑部撤稿,原因是数据异常及细胞系异常。论文中使用的 HepG2 细胞系 (no.HB-8065) 属于人肝细胞癌细胞系,被鉴定为错误分类的肝母细胞瘤细胞系,使用的人肝细胞癌细胞系 SMMC-7721 被鉴定为受污染的 HeLa 衍生细胞系,人永生化肝细胞系 L-02 被鉴定为受污染的 HeLa 衍生细胞系!

这是多么惨痛的教训,研究团队辛辛苦苦做了一场实验,且论文被广泛传阅引用,指引着后来人的研究,时隔多年后却发现从源头便是错了。众所周知,HeLa 细胞在人类的科研事业发展历程立下了汗马功劳,然而其也因经常更换马甲且混迹在各类细胞系中,令人不堪其扰。

科研人苦细胞污染和鉴定久矣

显而易见,细胞系容易受到其他生长更快的细胞系的污染。许多代表特定肿瘤类型的人类细胞系受到了其他癌细胞的污染,这种潜在的混淆会使人们的研究南辕北辙。自上世纪 50 年代以来,人们便意识到人类和动物细胞培养物的错误鉴定是一个长期的问题,需要引起重视。

1966 年 Stanley Gartler 通过对同工酶表达水平的鉴定,首次提出来源于 18 个独立个体的细胞系,如正常肠上皮细胞(Int-407)、正常羊膜细胞(WISH)、正常肝细胞(Chang liver)、喉癌(Hep-2)和口腔癌(KB),可能全是 HeLa 细胞的观点。1981 年,科学家 Walter Nelson-Rees 在利用核型分析对细胞进行鉴定后,证实了细胞库中的一系列细胞系确实存在着大量的 HeLa 细胞交叉污染。

2010 年,澳大利亚细胞库 Amanda Capes-Davis 等人在《国际癌症杂志》(International Journal of Cancer) 上发表综述,呼吁科研人们需要鉴定细胞系,并罗列了一份交叉污染或被错误识别的细胞系清单。这个假细胞系数据库现在由国际细胞系认证委员会 (ICLAC) 管理。

打开网易新闻 查看精彩图片

来源:International Journal of Cancer

综述中提到的假细胞系数据库的最新版本于 2014 年 10 月更新 (v7.2),列出了438 个假细胞系,且目前没有任何有力的证据证明这些细胞系是真实的。并且,其中有 37 个其他细胞系存在交叉污染的情况。

HeLa 细胞是该数据库中最常见的污染物,造成了 24% 的假细胞系来源。但 HeLa 细胞并不是唯一的罪魁祸首。假细胞系数据库列出了 138 种不同的污染细胞系,涉及到被广泛使用的细胞系,如 T-24(膀胱癌)、HT-29(结肠癌) 和 K-562(慢性髓性白血病) 均是常见的污染物,它们通常被误认为是前列腺癌、甲状腺癌或其他类型癌症的细胞系。

此外,数据库中的 50 个细胞系被其他物种交叉污染。例如,CHB(「人星形细胞瘤」,但实际上是大鼠),AMDURII(「人皮」,但实际上是猪皮) 和 ACCNS(「人类唾液腺癌」,但实际上是小鼠),这些披着错误马甲的细胞系极大地阻碍了抗癌治疗与药物开发领域的进展。

警惕拼写错误的细胞系

除了被污染且鉴定错误的细胞系令人头大,多个拼写错误的细胞名称正在被视为独立细胞系,愈演愈烈,问题逐步扩大。

打开网易新闻 查看精彩图片

来源:biorxiv

如上图所示,悉尼大学 Jennifer Byrne 领导的 PRIMeR 团队发现大量 SCI 论文涉及使用 NV(Non-Verifiable)细胞系名称,而且相当一部分 NV 细胞系名称正逐渐被视为独立的细胞系。

研究团队描述了 23 个无法验证的人类细胞系(non-verifiable human cell line identifiers),其中大多数可能来源受污染的癌细胞系的拼写错误。在详细研究的 8 个 NV 细胞系中,有 7 个 NV 细胞系 (BGC-803, BSG-803, BSG823, GSE-1, HGC-7901, HGC-803,MGC-823) 在 235 篇论文中竟然意外地被称为「独立细胞系」

令人警惕的是,这些论文涉及了癌症研究、生物化学、化学和药物研发等多个领域,有的论文影响因子高达十几分,被同行研究者多次引用,一定程度上左右着科研领域的发展。

一些论文作者声称已经制作了 3 种 NV 细胞系的遗传图谱,6 个 NV 细胞系被声称来自 ATCC 等大型细胞系库。然而,研究团队找不到任何关于这些细胞系最初是如何建立的、公开出版的论文或者实验指南。

Jennifer Byrne 认为,研究人员应该重点关注 NV 细胞系,正如细胞系污染问题一样,细胞系身份支撑着后续的实验结果与实验走向,严重影响科研的严谨和可信性。研究人员应该对拼写错误的细胞系名称采取零容忍的态度,并将所有已发表的细胞系名称与其相应的研究资源标识符(RRID)配对,在开展实验之前都应秉承着负责与严谨的态度,首先检查和鉴定无法识别的细胞系的真正身份!

牢记惨痛教训,做好细胞系认证

面对影响如此巨大的真假细胞系问题,Nature 杂志早在 2015 年 5 月份起就已经要求投稿者审查论文中使用的细胞系,以此来确保实验数据的准确性。

打开网易新闻 查看精彩图片

来源:Nature

为避免和解决上述困境,国际细胞系认证委员会 (ICLAC) 曾发布细胞鉴定相关指南与建议:

首先,开展细胞研究实验之前,要根据可靠的信息来源选择细胞株,例如查询Cellosaurus 数据库、ATCC、DSMZ 数据库等,根据细胞的基因型、表型及起源等信息来选择适合实验的细胞株

之后,需要查询目标细胞株是否存在既往错误识别/被污染的情况,从可靠、规范来源获取细胞,了解细胞的来源。

1.ICLAC 网址http://iclac.org/

2. 错误识别细胞登记表http://iclac.org/databases/cross-contaminations/

3.《给科学家们的建议: 使细胞鉴定成为日常细胞系培养的一部分》:https://iclac.org/resources/advice-scientists/

但是,完成上述步骤仍是不够的,及时进行细胞系鉴定是重中之重。研究人员获得的细胞系可能在开始使用之前就被交叉污染了,或者可能正在使用一个别人都不知道的假细胞系。

目前较为广泛使用的鉴定技术 STR 基因分型(Short Tandem Repeat,短串联重复序列)被认定为细胞鉴定的金标准,其原理是根据细胞系遗传特性建立细胞系信息,通过与权威的细胞 STR 数据库比对来确定是否发生交叉污染或误认。不少方法已被用来检测细胞交叉污染,包括同工酶分析、核型分析、人类白细胞抗原(HLA)分型,免疫分型和 DNA 指纹识别等,SNP 鉴定和 DNA 条形码技术等常被用于鉴定细胞系。

总之,科学的本质是严谨和精细,在进行细胞实验前科研人员一定要吸取前人失败经验,慎重、慎重再慎重,以免到最后竹篮打水一场空,白白地浪费时间和精力,给他人以错误引导!

编辑:苍术