来源:Quantitative Biology 发布时间:2025/6/26 16:32:03
选择字号:
QB  清华大学江瑞教授团队提出人类心脏染色质可及性数据库

论文标题: CASHeart: A database of single cells chromatin accessibility for the human heart

期刊:Quantitative Biology

作者:Qun Jiang, Xiaoyang Chen, Zijing Gao, Jinmeng Jia, Shengquan Chen, Rui Jiang

发表时间:12 February 2025

DOI:https://doi.org/10.1002/qub2.90

微信链接:点击此处阅读微信文章

人类心脏作为维持生命活动的关键器官,其复杂的生物功能和重要的医学意义使其成为生命科学研究的重点对象。深入理解心脏的发育过程、生理功能及疾病机制,对于心血管疾病的诊断、治疗和预防具有重要意义。在此背景下,研究心脏的染色质可及性对于揭示其表观遗传特征、解析细胞类型特异性的调控网络以及发现潜在治疗靶点至关重要。近年来,随着单细胞测序技术的发展,已有多项关于人类心脏单细胞染色质可及性的数据被发表。然而,这些数据存在来源分散、数据混杂、基因组版本不统一及批次效应等问题,制约了其深入利用。因此,亟需构建一个大规模、高质量、统一标准的人类心脏单细胞染色质可及性数据库,以支持系统性的表观遗传与基因调控研究。

近期,清华大学自动化系江瑞教授课题组Quantitative Biology发表了一篇题目名"CASHeart: A database of single cells chromatin accessibility for the human heart"的文章,系统整合并处理公开数据以揭示人类心脏细胞类型异质性,推动心脏发育、功能维持、疾病发生及治疗响应等分子机制的深入研究。

全文概要

CASHeart主要包括数据集构建与网站开发两个部分。在数据集构建方面,研究团队收集了Kai和Silvia等人构建的成人与婴儿单细胞染色质可及性图谱中的9个心脏组织样本,分别命名为HGCA和FCA。此外,还整合了Kanemaru等人构建的人类心脏微环境空间多组学数据中的47个样本。为确保基因组版本一致,所有样本的基因组坐标统一转换为GRCh38(hg38)。随后,研究者使用SnapATAC2工具中的MACS3方法对所有片段文件进行统一的峰位识别,并通过EpiScanpy结合基因注释文件计算每个细胞的基因活性得分,最终构建出标准化的人类心脏单细胞染色质可及性数据集。CASHeart在线平台包含首页、浏览、搜索、下载、教程、分析和关于七个主要界面。首页简要介绍平台目的、数据概况及更新记录;浏览界面采用“数据集-样本-细胞类型”三级结构,展示UMAP可视化图及EpiScanpy差异可及性分析结果;搜索界面支持按条件筛选并返回详细注释信息;下载界面提供不同特征数量的数据及基因活性得分下载;教程界面说明各模块使用方法;分析界面提供Python示例。

图1 CASHeart数据库中数据收集与处理流程概览

CASHeart能够准确揭示心脏细胞类型的异质性:

不同细胞类型在染色质可及区域表现出特异性表观遗传特征,进而在降维和聚类后呈现出不同的数据分布。研究通过对CASHeart与原始数据的聚类效果对比,评估其在揭示细胞类型特异性方面的有效性。采用统一的TF-IDF处理、PCA降维、Harmony批次校正,并通过UMAP可视化。结果显示,CASHeart在Louvain与Leiden方法下均优于原始数据,聚类准确性更高。且CASHeart数据在校正批次效应后更好地区分心肌细胞与非心肌细胞,聚类效果优于原始数据,进一步提升了细胞类型识别的准确性与稳定性。

CASHeart促进差异可及染色质区域及激活基因的分析:

CASHeart平台通过整合单细胞染色质可及性数据及基因活性评分,支持心脏发育与疾病研究中差异可及染色质区域及激活基因的多层次分析。该平台能识别细胞类型特异性表观遗传特征,如心肌细胞中ANKRD1基因附近区域(chr10_90916663_90917163)的显著可及性,该基因与心肌病相关;同时揭示LDB3(编码心肌连接复合体蛋白ZASP)等细胞特异性激活基因。分析结果显示,差异可及区域能有效区分心肌细胞与其他细胞类型,而基因活性评分虽非直接来自转录组,仍可辨识主要细胞群。这些功能为探究心脏疾病分子机制及靶向治疗提供关键工具。

CASHeart可作为参考数据集以增强心脏表观基因组与转录组数据分析:

研究表明,将CASHeart作为参考引入Hocker2021单细胞染色质可及性数据中后,稀有细胞类型(如淋巴细胞、巨噬细胞、脂肪细胞和神经元)的聚类效果显著增强,心房与心室心肌细胞的亚型也得以更清晰区分。进一步分析显示,同类亚型间在开放染色质区域的可及性存在差异,体现出更细致的表观调控特征。在转录组数据方面,引入CASHeart推算的基因活性评分后,Wang2020与Tucker2020两个真实人类心脏转录组数据集的聚类结果显著改善,心肌细胞及免疫细胞的亚型划分更加明确。定量评估也证实聚类指标全面提升。总体而言,CASHeart作为参考数据集,显著增强了心脏单细胞组学数据的聚类性能与亚型解析能力。

CASHeart促进心脏特异性基因调控及遗传变异研究:

CASHeart通过整合心脏细胞的单细胞染色质可及性数据,促进了心脏特异性基因调控与遗传变异研究。研究采用Cicero工具分析各细胞类型中的共可及性区域,揭示了心肌细胞中特异性基因调控机制。以MYH6为例,发现其上游多个区域存在共可及性,部分位于调控相关的非编码RNA(如MIR208A)与功能相关基因(如CMTM5)中,说明该基因受复杂调控网络控制。此外,对差异可及区域如chr3_39186401_39186901的分析也揭示增强子与启动子的调控关系。进一步地,研究通过LDSC评估CASHeart提供的可及性区域与130种复杂性状/疾病的遗传变异富集关系,结果显示前20位中有4个与心脏相关,显著富集(p=0.00532),体现其在心脏疾病遗传研究中的价值。SNPsea分析也验证了这些变异显著影响心肌细胞和平滑肌细胞,证明CASHeart在揭示心脏组织特异性遗传机制中的功能潜力。

未来应用前景:

CASHeart作为首个聚焦人类心脏单细胞染色质可及性的大规模数据库,未来在心血管表观遗传学研究中具有广阔的应用前景。其统一标准处理的数据可作为参考,显著提升外部数据的降维和聚类分析效果,进而优化差异可及性与差异表达分析。同时,融合基因活性评分促进跨模态整合分析,有助于深入理解心脏基因调控机制。CASHeart在线平台提供的数据浏览、搜索与下载功能,为研究者提供了便捷工具,推动了心脏发育、疾病机制与药物反应研究。此外,CASHeart弥补了现有数据库在心脏单细胞染色质可及性分析方面的空缺。未来,随着数据库持续更新扩容、批次效应校正方法改进,其在揭示心脏表观遗传调控网络与疾病相关变异机制中的价值将进一步提升。

QB期刊介绍

Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。

《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
天关卫星发现新型暂现X射线天体 韦布发现一颗小型气态巨行星
中麦578黄淮海区创大面积实收高产典型 新型催化剂在工业级大电流密度下稳定运行
>>更多
 
一周新闻排行
 
编辑部推荐博文