“论文发布之后,很快就有公司联系我们讨论转化事宜。和标准的 PacBio 建库测序方法相比,我们提出的 LILAP 方法,适用于高通量测序。

同时,其所需要的 DNA 输入量更少,建库更简单、更快速,成本也更低。”

对于自己和同事研发的 PacBio 建库新方法,中国科学院动物研究所助理研究员贾行 hang 星这样介绍。

图 | 贾行星(来源:贾行星)

LILAP(Low-Input, Low cost, and Amplification free library-generation method for PacBio sequencing),本质上是一款低 DNA 输入量的三代测序建库方法。

它能在不扩增的前提之下,将 PacBio 测序的 DNA 建库输入量降低至 100ng,适用于解析小型生物并可以帮助解析其内共生体基因组,除此之外 LILAP 还非常适合微小肿瘤等医疗用途的微量珍稀样品。

预计 LILAP 将能用于研究那些 DNA 用量受限的小型生物、分析较大物种的体细胞变异、分析果蝇个体水平的全基因组突变规律、以及研究宿主-共生菌的协同进化规律。

(来源:Nature Communications)

贾行星表示, 当前测序技术正在不断朝着自动化和高通量的方向发展。这也是一个促使 LILAP 出现的原因,因为基于 Tn5 转座酶的 LILAP 方法更简单容易,比已有方法更适合自动化和高通量实施。

因此,当针对测序样品使用不同处理方法的时候,也会根据不同的测序目标而发生分化。

再加上基于 Tn5 转座酶的二代测序技术,已被广泛用于基因组测序研究和表观基因组测序研究,所以 LILAP 可以无缝衔接已有的、基于 Tn5 的表观遗传二代测序技术(比如 ATAC-seq 和 CUT&Tag 等)。

这样一来,就能实现从二代测序技术、到三代长读长测序的升级,帮助发现更多之前二代短读长测序技术无法发现的新规律。

(来源:Nature Communications)

LILAP 技术帮助挖掘单只果蝇基因组突变规律

总的来说,LILAP 基于 Tn5 转座酶来实现测序文库构建,具备低 DNA 用量、无扩增、低成本等优势。

针对模式物种黑腹果蝇,课题组利用 LILAP 实现了两个单只雄性果蝇的全基因组测序和高质量组装,进而获得了果蝇内共生菌 Wolbachia 的完整基因组。

通过基因组分析,他们发现两个新的转座子突变特性,首先就是简单和复杂的转座子插入更倾向于发生在 non-B DNA 序列富集的区域;其次,果蝇中的基因转换事件可以同时在 DNA 和 RNA 水平发生,并会让转座子变得同质化。

另据悉,通过利用 Tn5 转座酶和发卡结构的 PacBio 测序接头,LILAP 能够组成一个二聚体转座复合物,从而只需一步即可实现 DNA 的片段化和测序接头的连接,之后再去除过量的测序接头并完成 DNA 环化建库即可。

以上全部流程只需在单个试管之内即可完成,省去中间核酸回收步骤能够最大限度地减少建库过程中的 DNA 损失,从而可以显著降低 DNA 输入量。

另外,在测序接头中还可以添加条形码,从而能够用于多样本的混合建库测序。

研究中,该团队使用黑腹果蝇的 ISO1 参考基因组品系,来评估 LILAP 的效果。

结果显示:两个单只果蝇的读段测序质量中位数达到 36,碱基错误率低于 0.02%。

(来源:Nature Communications)

而从头组装的基因组 NG50 数值超过 6Mb,基因组的质量分数超过 60,即组装的碱基错误率低于 10-6,保守单拷贝基因组装覆盖度大于 98%,超过此前同类论文中的单只果蝇基因组组装效果。

同时,在全基因组组装结果中,课题组成功组装了内共生微生物 Wolbachia pipientis 的完整基因组。

通过检测 Wolbachia 基因组内的变异情况,他们发现了 3 个新的突变,为后续研究共生菌和宿主的互相作用提供了新线索。

(来源:Nature Communications)

“柴米油盐”的课题启动原因

谈及本次研究的启动原因,贾行星坦言:“这个说起来有点柴米油盐,我博士期间的研究课题一直进展缓慢,同时又面临比较大的生活压力,因为 2018 年,我刚结婚成家并已经读到博士四年级面临毕业和家庭的双重压力。”

因为博士研究课题屡屡受挫,所以就想另辟蹊径,开发一个短平快的新型测序技术,起码先保证博士学业的正常完成。

“当然,我并非随便一拍脑门就确定了这个课题,尽管之前我的研究工作磕磕绊绊,但是自从 2014 年读博以来我就对测序技术有着浓厚兴趣并且长期大量阅读测序技术相关文献。”其表示。

测序技术,被称为新时代的显微镜,目前已经成为生物学和医学等领域的基础研究工具。

读博的几年间,对于二代和三代测序技术,贾行星积累了不少研究经验,也产生了一些新想法。

于是,他决定选择一个非常简单、但又颇具巧思、且成功率最高的 idea 来测试。

制定本次课题之时,他曾做过多方面的考虑:其一,成功率必须要高;其二,容易实现、且周期短;其三,和自己所在实验室的研究方向契合。

恰好当时第三代测序技术正发展得如火如荼,贾行星所在的张勇研究员课题组更是在 2016 年左右,就已经开始使用第三代测序技术来鉴定基因组结构变异。

而之所以开发本次技术,则是因为 PacBio 测序有一个很明显的短板,那就是测序建库需要大量的 DNA 输入,从而限制了 PacBio 测序的应用范围。

当测序所需的 DNA 用量被降低之后,就可以实现小体型动物的基因组组装以及个体之间的遗传变异差异检测。

2018 年底,贾行星启动了本次课题,到 2019 年初其实已经基本完成初始版本 LILAP 技术的研发。

但在当时,初始版本的 LILAP 建库流程还比较复杂,中间涉及到一步回收 DNA 的操作步骤,这就会损失大量的 DNA,从而导致很难实现单只果蝇的测序需求。

为此,贾行星开始着手提高建库效率和优化流程,直到 2020 年终于实现了如下目标:只需在一个反应小管中就可以完成所有建库操作,如此就能实现单只果蝇建库测序的效果。

具体而言:就是将所有建库操作都在一个反应小管中完成,以便最大限度地减少 DNA 的损失,同时还能提高文库的环化效率。

“这里多亏了个人平时对于各种测序技术的经验积累,因为我们这个测序方法所需要的每一个关键细节,都是在各种前人论文中一点点搜集到、并最终被重新整合起来的。”贾行星说。

这时,技术层面的工作已经基本完成,但是新技术通常需要伴随新的发现才能进一步阐述和证明新技术的优势。

在贾行星的导师张勇研究员和中国农业科学院深圳农业基因组研究所阮珏研究员的指导之下,以及中国科学院动物所副研究员谭生军和博士生蔡英傲的加入,他们开始一步步完成个体黑腹果蝇的基因组组装、结构遗传变异和串联点突变的突变规律鉴定、以及共生菌基因组组装和突变的鉴定。

期间,贾行星也曾被一个简单的常识困住。他表示:“LILAP 的技术优化过程可谓非常痛苦,因为对于我一开始的 idea 来说,它们都有着很好的参照模板,很容易就可以实现。”

但是,当将所有反应在一个小管中完成,并且要最大限度地提高文库环化效率,让他感到颇为费劲。

其表示:“这个真的卡了我好久,结果发现竟然是一个非常简单、并且很容易被忽视的常识,才是文库环化效率提升的关键点,即只需要将过量的测序接头消化掉,就可以让 DNA 连接酶不再被无效占有,从而提高建库效率。”

“事实也证明:我的初始 idea 其实也有其他人想到,并且也被其他人用于别的课题中。但是,在最终的建库操作上,我们提出的 LILAP 方法毫无疑问是更具巧思的,关于这一点我还蛮自豪的。”贾行星说。

而通过本次合作,也让他对于团队合作有了更深刻的体会。

他说:“每个人的禀赋很不一样,谭生军老师不仅计算能力超强,而且在研究结果呈现方面的天赋着实令我自叹不如,蔡英傲师弟从一开始的小白、到最后承担大量计算工作的成长速度和靠谱程度也让我刮目相看。”

最终,历经四年多的打磨,相关论文以《低输入 PacBio 测序可生成高质量的单个果蝇基因组并表征突变过程》(Low-input PacBio sequencing generates high-quality individual fly genomes and characterizes mutational processes)为题发在 Nature Communications 杂志[1]。

中国科学院动物所助理研究员贾行星、副研究员谭生军、以及博士生蔡英傲是共同一作。

中国科学院动物所张勇研究员、中国农业科学院深圳农业基因组研究所阮珏研究员、贾行星、谭生军担任共同通讯作者。

图 | 相关论文(来源:Nature Communications)

未来,他们打算将本次方法扩展到更多小体型生物的基因组测序研究中,加速小体型生物的基因组研究。

同时,还打算将 LILAP 扩展到基因组重测序以及 ATAC-seq 和 CUT&Tag 等表观遗传测序领域,以及通过技术转化来加快 LILAP 的推广和应用。

参考资料:

1.Jia, H., Tan, S., Cai, Y. et al. Low-input PacBio sequencing generates high-quality individual fly genomes and characterizes mutational processes. Nat Commun 15, 5644 (2024). https://doi.org/10.1038/s41467-024-49992-6

运营/排版:何晨龙

01/

02/

03/

04/

05/