作者丨上智院「女娲」团队、复旦大学人工智能创新与产业研究院、临港实验室等
编辑丨ScienceAI
在数字病理分析中,细胞实例分割是不可或缺的基础工具,其精度直接影响细胞计数、形态分析、空间组织学研究乃至肿瘤分级等关键临床与科研任务的可靠性。生物组织中细胞往往呈现高密度堆叠和形态多样的特征,精准区分每个细胞实例的边界与归属,是长期困扰领域的核心挑战。
然而,面对复杂的病理图像数据,现有基于检测、轮廓预测或距离映射的方法虽各有进展,却普遍存在核心局限,难以满足临床对高密度重叠场景的分析需求。
为此,上海科学智能研究院(下称上智院)与复旦大学、上海交通大学、临港实验室等机构联合提出了首个邻接感知的细胞实例分割框架(Disco)。该框架从细胞邻接图的拓扑本质出发,通过「显式标记」与「隐式消歧」双机制协同,实现了从特征学习到分割推理的全流程优化。
实验表明,Disco 方法在四个异质性数据集上平均性能提升达 2.72%,在高密度挑战性场景中 PQ 指标更是实现 7.08% 的显著突破,为开发高性能 AI 辅助病理分析工具开辟了新路径。
现有方法的两大核心局限
既往细胞实例分割方法虽在特定场景取得进展,但面向真实临床病理图像时,存在两个关键短板:
一是缺乏全局拓扑建模:主流方法依赖局部像素或几何信息推断细胞归属,却忽视了细胞间的全局拓扑约束。检测类方法受限于边界框表示和非极大值抑制的启发式逻辑,在密集重叠场景易漏检;轮廓类方法对二值化阈值高度敏感,易出现欠分割或过分割;距离映射类方法则依赖复杂后处理重构实例,易导致误差传播。这些方法的决策本质上是局部最优,面对高密度细胞集群的全局复杂性时极易失效。
二是着色方案适配性不足:基于图着色理论的新方法虽具备全局拓扑感知能力,但存在「Goldilocks 困境」:简单 2 色着色模型基于二分图假设,无法处理真实细胞图中普遍存在的奇环结构;而 4 色着色等高阶模型又会引入不必要的表征冗余和优化难题,未能匹配真实细胞拓扑的复杂特性。
为解决这些问题,研究团队从细胞邻接拓扑分析和临床病理需求双重视角出发,构建了 Disco 框架,实现从信号表征到分割推理的全流程优化。该框架与病理分析的知识体系对齐,使得研究者不仅能获得精准的分割结果,更能通过冲突图理解细胞拓扑复杂性,推动病理 AI 分析更具可解释性。
图示:主流方法对比。
Disco的双机制创新设计
Disco 框架以「分而治之」为核心原则,包含「显式标记」与「隐式消歧」两大核心机制,形成从拓扑分析到分割优化的完整技术闭环。
1. 显式标记:拓扑冲突的结构化建模
通过广度优先搜索(BFS)提取细胞邻接图中的最大二分子图,将绝大多数简单结构的细胞节点分为两组,对应两种基础颜色;同时将剩余构成「冲突集群」的非二分结构节点整合为冲突集,分配专属冲突颜色。这种动态适配策略既避免了 2 色着色的理论不足,又摒弃了高阶着色的冗余,生成兼具效率与拓扑信息的监督信号。
2. 隐式消歧:连续空间的特征分离
构建解耦的约束损失系统,通过损失组件协同优化,实现复杂场景下的实例清晰分离:
- 基础损失:分别监督前景、背景分割和多类着色任务,确保细胞区域识别与标记准确性;
- 正则化损失:形成「推拉」机制,抑制二分区域的冲突颜色误用,同时强化冲突区域的精准预测;
- 邻接约束损失:通过最小化相邻细胞实例的特征余弦相似度,在连续特征空间强制实例分离,有效解决冲突节点间的二次冲突问题。
图示:Disco 双机制设计。
在四大数据集上超越现有最优方法
研究团队在 PanNuke、DSB2018、CryoNuSeg 及 GBC-FS 2025 四大异质性数据集开展系统评估,结果全面超越现有最优方法(SOTA),展现出卓越的泛化能力与鲁棒性:
平均性能显著提升:在所有数据集上平均PQ指标提升 2.72%,在高密度复杂场景中 PQ 提升达 7.08%,AJI 指标达到52.09%,较 SOTA 实现 6.91% 的绝对提升,优势尤为突出;
全场景自适应适配:在完全二分图的简单场景中,自动退化为高效2色着色模型,AJI 和 PQ 指标均居首位;在高密度重叠的复杂场景中,仍能精准分离紧密聚类的细胞实例,实现全复杂度场景的高效覆盖;
多模态高效兼容:在 H&E 染色、荧光成像等不同模态,以及不同组织类型的数据集上均保持领先性能,适配临床多样化病理图像需求;
此外,模型生成的「冲突图」可直观呈现不同组织区域的拓扑复杂性,为病理学家量化组织异质性、识别关键病变区域提供了全新工具,间接提升了研究的临床适配价值。
图示:细胞拓扑结构分析。
核心组件的必要性验证
为验证 Disco 框架中各核心组件的贡献,研究团队在高密度复杂场景下开展系统消融实验,遵循控制变量原则量化各模块贡献:
拓扑建模的有效性:纯 2 色着色基线模型 AJI 仅 37.85%,而 Disco 的显式标记策略通过冲突集建模,显著提升了复杂结构的处理能力;
邻接约束损失的关键作用:单独加入邻接约束损失即可使 PQ 指标从 42.57% 提升至 48.26%,证明其在解决二次冲突、强化实例分离中的决定性作用;
动态着色的优势:相较于静态 3 色着色和 4 色着色方案,Disco 的「2+1」动态策略避免了表征冗余,PQ 指标分别领先 9.65% 和 7.08%,验证了其适配真实拓扑的合理性。
这些实验从多个维度证实,显式标记与隐式消歧两大核心机制协同发力,共同支撑了模型在各类场景中的性能突破,尤其在高密度重叠场景中展现出不可替代的优势。
总结与展望
Disco 的成功,核心在于对病理场景本质的深刻洞察与算法创新——通过精准捕捉细胞邻接拓扑的核心特征,实现了对不同复杂度场景的自适应高效处理。
首先,模型从细胞邻接拓扑的物理与生物学特性出发,揭示了真实细胞图「近二分但富含冲突集群」的核心特征,使特征学习更贴合病理本质;其次,通过动态着色与约束损失系统,将模型流程与病理分析的逻辑深度对齐,在提升性能的同时显著增强了结果的可解释性;此外,其对高密度、噪声场景的适应能力,兼顾了效率与临床实用性。与此同时,团队也同步开源了 GBC-FS 2025 数据集与相关评测资源,为后续方法迭代与公平对比提供了统一基准。
该研究不仅为细胞实例分割提供了新的技术路径,也印证了 AI 医疗发展的关键方向——唯有将领域知识与人工智能技术深度融合,才能开发出真正赋能临床的实用工具。
展望未来,研究团队计划将本框架扩展至更多病理分析场景,包括多组织类型适配、多模态病理数据融合等,为智能病理的落地持续注入新动力。
论文信息:
该研究成果已被 ICLR 2026 接收。上智院实习生、复旦大学博士生孙瑞和上智院实习生、上海交通大学博士生杨逸文,为共同第一作者。上智院实习生郭凯与、徐东篱,上海交通大学附属仁济医院博士生刘照南,上智院实习生、复旦大学博士生潘覃,复旦大学人工智能创新与产业研究院(下称复旦大学 AI³ 院)副院长韩丽妹,复旦大学生医工创新学院教授江雪,为共同作者。上智院生命科学方向负责人、复旦大学 AI³ 院研究员程远,临港实验室研究员魏武,上智院生命科学方向研究员蒋晨,为共同通讯作者。
研究项目由星河启智科学智能开放平台(https://aistudio.ai4s.com.cn/)和复旦大学 CFFF 智算平台提供技术和算力支持。
论文题目:Disco: Densely-overlapping Cell Instance Segmentation via Adjacency-aware Collaborative Coloring
论文地址:https://arxiv.org/abs/2602.05420
代码地址:https://github.com/SR0920/Disco
热门跟贴