华南农业大学园艺学院教授夏瑞团队在国家自然科学基金等项目的资助下,开发了一种基于基因共线性进行物种基因组基因结构注释矫正的工具——SynGAP(Synteny-based Gene structure Annotation Polisher)。相关成果近日在线发表于《基因组生物学》(Genome Biology)。
SynGAP基因结构注释矫正的设计逻辑与流程。研究团队 供图
?
演化过程中,在具有共同祖先的近缘物种之间,染色体上同源基因存在保守排列的现象,被称为基因共线性。近缘物种的基因共线性区块中,部分基因丢失了与其对应的共线性基因,进而在区块内形成共线性对的间隔。共线性基因的缺失,可能由基因组序列的变化引起的,同时还有可能是错误注释或缺失的基因模型导致的。
基于后一种可能性,夏瑞团队通过两物种的共线性分析,检测出共线性区块中共线性对的空缺位置。随后进行双向的同源比对以实现对间隔内潜在注释错漏的初步鉴定与矫正。再通过去冗余、可靠性指标计算筛选、参考注释质量分级等步骤对初步矫正结果进行质控,最终获得两物种的高质量矫正注释,并且实现对间隔的填补。
论文第一作者、华南农业大学园艺学院博士研究生吴锋琦表示,通过多个植物、动物物种组合的测试与统计,明确SynGAP可以对被测试基因组基因结构注释进行优化——增加优质新基因注释以及共线性基因对,同时提高了BUSCO完整度。
除了基因结构注释矫正功能模块外,SynGAP还包含了一套物种间比较转录组分析流程。通过该流程可实现近缘物种间的准确基因配对,并结合转录组数据完成跨物种时序性转录组分析,高效地筛选鉴定候选关键差异表达基因。其中,设计了EVI这一基因差异表达指标,可同时体现物种间对应基因的表达水平差异、表达量倍数差异以及表达模式变化差异。基因对的EVI值越高,两个同源基因的差异表达就越显著。经测试,EVI可以作为鉴定控制特定性状或发育过程(如花色素苷合成、辣椒素合成、内果皮木质化和大脑体积增大)的候选关键基因的有效指标。
论文共同通讯作者夏瑞表示,SynGAP基于近缘物种基因共线性,去鉴定并矫正原始基因结构注释中的潜在错漏,实现了基因结构注释的优化;并为更精准的比较基因组和比较转录数据分析提供了新策略。(来源:中国科学报 朱汉斌 李彦华)
相关论文信息:https://doi.org/10.1186/s13059-024-03359-8