|
|
QB期刊 |中国地质大学(武汉)李宏伟教授团队提出基于交换对比学习的单细胞转录组数据聚类算法 |
|
论文标题: scSCC: A swapped contrastive learning-based clustering method for single-cell gene expression data
期刊:Quantitative Biology
作者:Xiang Wang, Sansheng Yang, Hongwei Li
发表时间: 15 Jun 2025
DOI:10.15302/J-FASE-2022452
微信链接:点击此处阅读微信文章
细胞聚类问题作为转录组数据分析任务的重点,对于帮助注释细胞类型,识别标记基因,发现罕见细胞类型具有重要意义。随着单细胞转录组测序技术(Single-cell RNA Sequencing,scRNA-seq)的发展,准确的无监督聚类结果能够大幅降低细胞类型注释的人工成本,对于揭示新的生物学现象至关重要。
近期,中国地质大学(武汉)数学与物理学院李宏伟教授课题组在Quantitative Biology期刊发表了一篇题目名为"scSCC: A swapped contrastive learning-based clustering method for single-cell gene expression data"的文章,提出了一个基于交换对比学习的细胞聚类方法scSCC,通过利用交换预测策略来增强细胞低维嵌入表示的聚类结构,帮助提高聚类任务的精度,并在多个数据集上取得了优越性能。

全文概要
研究团队开发的scSCC(Swapped Contrastive Clustering for scRNA-seq Data)方法,通过实例对比学习模块学习细胞特征表示,同时引入交换预测对比学习模块,通过伪标签之间的交换预测,使得相同细胞类型的细胞在特征空间中相互靠近,以增强细胞特征表示的聚类结构。scSCC通过结合实例对比学习与交换预测对比学习提取出适合聚类的低维细胞嵌入表示,帮助提高聚类任务的精度,为scRNA-seq数据聚类分析提供了一种高效且准确的新工具(图1)。

图1. scSCC算法框架图。
(a) scSCC网络框架图。(b) scSCC细胞聚类示意图。
scSCC在不同scRNA-seq数据上实现准确的细胞聚类:
研究团队在十个真实scRNA-seq数据集上与七种不同的scRNA-seq数据聚类算法进行对比,以评估scSCC方法的聚类准确性。通过调整Rand系数(Adjusted Rand Index, ARI)和归一化互信息(Normalized Mutual Information, NMI)来衡量聚类结果,scSCC在十个数据集上取得最优的综合性能,并分别在七个数据集上取得最高的ARI得分和NMI得分。此外,为评估聚类结果的合理性,研究团队选用轮廓系数(Silhouette Coefficient, SC)和Davies-Bouldin分数(Davies-Bouldin Index, DBi)对特征表示进行评估。结果表明,scSCC的聚类结果能够获得最高的综合SC得分和最低的DBi得分,说明了聚类结果的合理性。
scSCC能够提取适合聚类的特征表示:
研究团队通过对细胞特征表示进行t分布随机邻居嵌入(t-distributed Stochastic Neighbor Embedding, t-SNE)可视化以直观展示各算法的聚类结果。scSCC 所得到的细胞特征表示在不同细胞类型之间具有更清晰的边界, 并且相比于其他对比算法, scSCC 在大多数数据集上能够得到更纯的细胞聚类簇, 不同细胞类型的混合程度较小。
scSCC使用交换预测模块帮助提高聚类准确性:
研究团队进一步验证了交换预测模块的有效性,通过对实例对比学习模块和交换预测模块的消融结果进行对比,观察到scSCC的算法性能优于消融算法,表明了交换预测模块结合实例对比模块对于聚类效果的提升,展现出交换预测模块的有效性。
未来应用前景:
本文提出的scSCC方法通过联合实例对比学习和交换预测对比学习,为scRNA-seq数据聚类分析提供了一种高效且准确的工具。与传统的聚类方法相比,scSCC方法能够通过交换预测策略在网络训练过程中加入聚类信息,从而增强细胞嵌入表示的聚类结构,由此达到提高聚类准确性的效果。此外,目前的scSCC方法主要针对聚类分析任务,考虑到对比学习方法在其他任务上的成功,未来可以考虑将scSCC方法用于整合分析等其他scRNA-seq数据分析任务,进一步提高算法的适用性。
QB期刊介绍
Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。