近期,香港城市大学李润生团队

bioRxiv
预印本平台发表了一项系统比较研究,题为《When CycloneSEQ meets Oxford Nanopore Technologies: a performance comparison of contemporary nanopore DNA sequencing platforms》(Liu et al.)。该研究通过六种细菌样本的全基因组测序数据,从读长准确率、组装完整性与表观基因组学应用等维度,客观对比了华大序风CycloneSEQCS2(对应CycloneSEQ平台的S0体系)与Oxford Nanopore Technologies(ONT)R10.4.1平台的性能差异。

核心结论显示:

  • CycloneSEQ的测序数据Modal值达97.7%(Q16.4),经短读长校正后组装完整性接近100%,并能识别12种细菌甲基化基序。

  • 研究指出,在关键性能指标上,CycloneSEQ已展现出与ONT相当的能力。

打开网易新闻 查看精彩图片

DOI:10.64898/2026.01.14.699587

纳米孔测序技术发展现状

纳米孔测序凭借其长读长、实时测序、直接检测表观遗传修饰等独特优势,在病原体快速鉴定、基因组完成图构建、耐药基因追踪等场景中展现出重要价值。长期以来,该领域由ONT主导。CycloneSEQ平台的出现,被视为中国在纳米孔测序领域实现自主知识产权的重要进展。

该研究是首个系统性、多维度比较CycloneSEQ与ONT平台性能的独立评估工作,既验证了CycloneSEQ平台的技术可行性,也为其在实际应用中的定位与发展提供了客观依据。

打开网易新闻 查看精彩图片

图:项目设计概览。

核心性能分析

reads准确率:

CycloneSEQ CS2实现显著提升

数据表现:

CycloneSEQ CS2平均观测准确率96.0%(Q14.0),Modal值97.7%(Q16.4)

ONT R10.4.1平均观测准确率96.8%(Q14.9),Modal 值99.0%(Q20)

差距变化:与CS1版本相比,CS2将平均准确率差距缩小至0.8%

技术解读:

这一进步得益于CycloneSEQ平台的文库制备和碱基识别算法的协同优化。研究指出,CycloneSEQ CS2的估计准确率与观测准确率之间的差距已收窄至0.39%,表明其碱基质量值(Q-score)校准更为可靠。这有助于在数据分析中更准确地依据原始Q值进行过滤。

r

同聚物区域性能:

超越R9.4.1,逼近R10.4.1

关键发现

同聚物(Homopolymer)区域的准确测序是纳米孔技术的一大挑战。研究表明CycloneSEQ CS2在A/T和G/C同聚物的识别准确性上表现优于ONT R9.4.1,接近R10.4.1水平这对于精准解析细菌的相变基因、毒力岛等富含重复序列的区域具有重要的实际意义。

打开网易新闻 查看精彩图片

图:纳米孔测序平台之间的读段质量比较。

基因组组装性能:

从"原始数据"到"完成图"的完整路径

原始长读长组装的挑战与解决方案

原始读长组装挑战:

CycloneSEQ原始读长的插入/缺失(InDel)错误率高于ONT,导致未校正前每100 kbp存在超过4个InDel。不过,通过结合约50倍覆盖度的长读长与短读长校正,可显著改善组装质量,获得近乎完整的细菌基因组

校正后表现优异

采用50×覆盖度结合短读长校正后:

组装完整性提升至近100%(细菌染色体回收率>99.9%)

BUSCO评估稳定在97%完整性分数

InDel密度降至每100 kbp约1个,与ONT校正后水平相当

操作建议

标准流程:推荐采用"CycloneSEQ长读长+ 短读长混合组装"策略

成本控制:相较于纯ONT R10.4.1测序,CycloneSEQ在试剂成本上具有潜在优势,可将节省的资金投入短读长校正

打开网易新闻 查看精彩图片

图:纳米孔测序平台的组装质量表现。

覆盖度优化策略

研究发现

组装完整性在50×覆盖度后呈现边际效益递减,80×覆盖度下各平台(R9.4.1, R10.4.1, CS1, CS2)的BUSCO分数无显著差异。这为制定经济高效的测序方案提供了直接依据。

打开网易新闻 查看精彩图片

图:纳米孔测序平台的组装质量表现。

推荐方案

常规菌株鉴定30-50×覆盖度

高质量完成图50-80×覆盖度 + 短读长polishing

复杂重复区域解析可适当提高至100×

表观基因组学应用:

甲基化检测的独特优势

检测能力与灵敏度

核心发现:

研究团队成功利用CycloneSEQ reads中存在的链特异性错误,从头发现了12种细菌DNA甲基化motifs(methylation motifs),包括:

  • 常见的GATC(Dam甲基化)、CCWGG(Dcm甲基化)

  • 罕见的CTGCAG、GCGC等motifs

  • 潜在的新甲基化 motifs 发现能力

技术机制:

与ONT类似,甲基化碱基在纳米孔中产生的电流信号偏移导致碱基识别错误,通过比较正负链的测序错误模式,可高灵敏度定位甲基化位点。这证明了CycloneSEQ平台在无需额外实验处理的情况下,直接检测6mA、4mC等细菌常见甲基化修饰的能力。研究团队还为此开发了适配CycloneSEQ信号的分析流程,为表观基因组学研究打开了大门。

与ONT的性能对比

CycloneSEQ表现亮点:

motifs覆盖广度在部分菌株中识别出ONT未检测到的甲基化模式。

信号特征独特的错误谱可能为新型表观遗传标记的发现提供线索。

待改进:

CCWGG过拟合CycloneSEQ碱基识别模型在该motifs上存在系统性偏差,导致假阳性率升高,需设置更严格的过滤阈值。

打开网易新闻 查看精彩图片

图:CycloneSEQ 平台检测到显著电流信号差异。

CycloneSEQ技术优势与改进方向

当前优势:

快速迭代能力CycloneSEQ在数月内完成从CS1到CS2的更新,实现关键性能大幅提升。

成本效益“50倍覆盖度+短读长校正”方案兼具质量与经济性。

待改进方面

InDel错误率研究指出单碱基插入缺失是CycloneSEQ reads中最主要的错误类型,这也是影响无需校正的组装质量的核心因素。

特定序列的过拟合在甲基化motifs CCWGG上,模型在无甲基化的WGA数据中产生了异常高的错误信号,表明基础模型存在对训练数据的过拟合。

Q值校准精度CycloneSEQ CS1版本存在估计准确率高于观测准确率的情况,CS2虽已改善,但校准精度仍有提升空间。

技术演进:

CycloneSEQ S1体系展望

据悉,CycloneSEQ即将推出S1体系,涵盖试剂、算法与软件多方面的升级:

1

试剂与化学优化:“精进”测序试剂盒(S1 体系)

准确率提升:通过优化马达蛋白与生化体系的协同作用,旨在将单碱基InDel错误率控制在更低的水平,原始测序准确率可达Q20以上。

增强的稳定性:改进的缓冲体系可提供更稳定的测序环境,显著提升有效数据产出率。

2

算法与软件升级:“精进”碱基识别器

抗过拟合模型:采用更大规模、更多样化的训练数据集(包括更多种属的WGS与WGA数据),重点解决如CCWGG等特定motifs的过拟合问题,提升模型泛化能力。

Q值校准:实现更精细的Q值校准,使质量分数能更真实地反映每个碱基的识别置信度。

同聚物优化:针对G/C同聚物识别准确率相对较低的问题,进行专项模型优化。

3

分析生态扩展:“拓展”分析套件(CycloneFlow)

通过集成自主开发的专用生信工具集,全面赋能长读长数据分析。该套件核心包括:长读长序列条码拆分工具Citrus、长读长测序修饰检测数据分析工具 Poremod、长读长序列质控分析工具Rosa等。

未来展望

该研究是对CycloneSEQ技术路线的一次系统性验证,也是中国纳米孔测序产业化进程中的重要里程碑。尽管在原始读长准确率与生态系统成熟度方面仍有提升空间,但CycloneSEQ在组装后质量、表观遗传学应用与成本控制方面已展现出差异化竞争力。

从CycloneSEQ CS1到CS2(S0)的快速迭代,体现了华大序风团队的技术执行力;即将到来的S1体系,则进一步彰显了CycloneSEQ平台在性能优化与用户需求响应上的持续投入。CycloneSEQ有望为全球科研工作者,提供一个高性能、高性价比且自主可控的纳米孔测序选择,推动生命科学研究的深入发展。

01

02

03

04

05

快点亮"在看”吧!