全切片图像(WSI)是病理诊断的核心载体,提供了直接影响临床决策的见解。数字病理学技术的兴起使WSI的大规模存储库得以构建,为精准医疗提供了强大支持,也为研究人类健康与疾病的组织基础创造了前所未有的机遇。但由于WSI数据以专有格式存储,需要使用不兼容的工具进行处理,并且难以与RNA-seq等多模态及单细胞分析流程整合。因此,在许多研究和临床应用中,数字病理学图像所蕴含的宝贵信息都未能得到充分利用。
为解决WSI计算分析面临的诸多挑战,奥地利国家科学院分子医药研究中心André F. Rendeiro、郑易民团队在Nature Methods发表简报“LazySlide: accessible and interoperable whole-slide image analysis”,报道了一种通用PythonWSI分析框架LazySlide,可用于WSI高效分析和多模态数据整合。该框架是一个基于scverse生态系统的开源Python软件包,通过采用最先进的深度学习模型,优化WSI预处理、图像分割、特征提取及多模态整合流程,成功将组织病理学与组学工作流程连接起来,支持组织和细胞分割、特征提取、跨模态查询和零样本分类,且无需过多设置即可快速投入使用。LazySlide使WSI分析更加容易使用、更具互操作性,并轻松地融入现代基因组学分析流程中,有望推动数字病理学分析的普及,从而实现组织病理学与基因组学分析之间的无缝结合。
据文章介绍,LazySlide的核心创新在于引入了一种基于scverse SpatialData框架构建的定制数据结构WSIData(图1)。该结构针对WSI数据的多样化格式和规模进行了优化。WSIData可实现对标准WSI格式的高效直接访问且避免数据重复,并兼容scverse工具及深度学习流程。此外,LazySlide框架遵循AnnData、Scanpy和Squidpy等成熟应用程序接口(API)规范,有效降低了计算病理学家和基因组学研究人员的使用门槛。
LazySlide有一套完整的WSI分析工具,涵盖预处理、定量分析、可视化呈现、多组学数据整合等基础功能,以及支持深度解读和交互式探索的高级功能模块,通过零样本学习方法和基因组数据整合技术实现高效分析。在基于图像的分析功能中,图像切片被分割为组织区域,拼接成内存高效的数据块,并通过视觉基础模型嵌入高维特征空间,为后续分析提供支持,揭示空间组织结构特征。同时,LazySlide内置的细胞分割与分类工具可实现细胞组成成分及形态学特征的定量分析。
此外,LazySlide还利用视觉-语言模型支持自然语言查询,使用户能够定位与提示词最相似的图像区域。同时,LazySlide还支持与转录组学及其他数据类型的多模态整合,助力疾病评分分析和机制阐释。在零样本能力方面,LazySlide支持切片标注生成、相关性评分及文本引导式分割,并实现高效、清晰的WSI分析与注释可视化,包括分割区域、细胞及提取特征等信息。
图1.LazySlide框架概述。
经测试,LazySlide可支持多种应用场景,与现有方法学严格对比测试表明其具有强大的功能与广泛适用性。研究团队通过三个代表性应用展示了LazySlide将WSI数据与其他模态相结合的能力(图2)。
1
零样本视觉-语言查询
研究团队收集了GTEx项目中的人类动脉切片数据,包含健康组织和钙化组织,以及相应的RNA-seq数据。用户仅需五行代码,即可计算每张切片的文本-图像相似性图。结果显示,与“钙化”相关的术语在钙化样本中呈现更高的富集度,而解剖学术语则在健康组织中占主导地位(图2b,c)。图像-文本特征的差异分析发现,间隙连接、血管微环境和细胞凋亡等术语在钙化动脉中显著富集,与形态学改变观察结果一致。此外,钙化组织的钙化评分显著升高。
2
组织学与转录组学的多模态整合
随后,研究团队利用钙化评分,对WSI衍生数据与RNA-seq嵌入数据进行多模态整合(图2e-h)。该分析仅需单行代码即可完成,结果显示在UMAP空间中图像特征比单独RNA-seq更能清晰区分健康组和钙化组。这一模式使用scverse多组学框架Muon捕捉到。将仅基于RNA差异表达分析或WSI+RNA联合分析对基因进行排序,比较基因水平与钙化的相关性。结果显示,仅WSI+RNA联合分析能识别关键钙化相关通路,包括IL-18信号通路,且总体上产生更多显著通路关联。
3
零样本器官分类
研究验证了LazySlide的零样本分类能力。通过视觉-语言模型,将来自9种不同人体器官的WSI与其器官名称进行比对查询(图2i-k)。仅需一行代码,LazySlide即可准确识别大多数器官来源。将相同方法应用于动脉钙化数据集时,同样展现出优异的分类性能,表明该模型无需组织特异性或上下文特异性训练即可提取有价值的信息。
图2.LazySlide应用与测试结果。
最后,研究团队还评估了LazySlide的易用性与性能表现。通过标准预处理流程对LazySlide与成熟工具进行基准测试:包括组织分割、数据切片、PyTorch数据集切片制备及特征提取。结果显示,LazySlide以更少代码行数、更低标记量及更简洁API完成该工作流程,显著提升了开发效率与代码维护便利性(图2l)。在小鼠乳腺癌肺转移分类任务中,LazySlide衍生特征始终优于QuPath衍生特征(图2m),无论采用自动化还是手动流程,LazySlide的组织分割速度均显著快于QuPath(图2n)。对LazySlide的功能特性与现有软件的定性对比显示,LazySlide具有卓越的灵活性及支持多种独特任务,包括文本-图像查询、RNA数据整合、零样本学习、无监督空间域检测、可视化呈现及虚拟染色功能。
图3.利用LazySlide检测人结肠组织中的细胞。
研究团队表示,组织学中蕴含着大量的生物信息,但这些信息往往难以通过计算手段进行有效处理。开发LazySlide旨在帮助研究人员以系统化、定量的方式分析组织图像,并将观察到的现象与相应的分子过程联系起来。LazySlide未来的发展重点将放在实现不同成像方式之间的数据协同处理能力以及三维组织重建技术的改进。
综上,LazySlide在AI驱动的组织病理学与组织生物学领域实现了重大突破,体现了计算病理学与组学数据整合领域的前沿应用价值。LazySlide通过模块化、用户友好且开源的框架,成功将计算病理学与多模态组学相结合,支持多种基础模型,实现了WSI的整合性、可扩展性及可解释性分析。LazySlide为深入探索组织生物学与疾病机制,加速开发具有临床意义的数据驱动模型提供了支持。
原文信息:
Zheng, Y., Abila, E., Chrenková, E. et al. LazySlide: accessible and interoperable whole-slide image analysis. Nat Methods (2026). https://doi.org/10.1038/s41592-026-03044-7
01
02
03
04
05
快点亮"在看”吧!
热门跟贴