作者:尹立林等 来源:《核酸研究》 发布时间:2023/2/28 13:32:01
选择字号:
基因组育种大数据计算新工具“天权”发布

 

近日,国际学术期刊《核酸研究》(Nucleic Acids Research)发表了华中农业大学动物遗传育种团队开发的基因组育种大数据计算新工具HIBLUP,中文名为“天权”。相关论文被期刊评为“突破性进展”论文。

该研究系统分析了已有遗传评估算法特点,针对现有算法在处理快速增长的基因组育种大数据时面临的瓶颈问题,首创基于V矩阵的“HE+PCG”策略,可完全避免遗传评估计算过程中的大矩阵求逆,开发出更适合基因组育种大数据时代的高性能计算新工具HIBLUP。与现有工具相比,“天权”计算速度最快且消耗内存最少,而且基因分型个体在群体中占比越大,优势愈明显。此外,“天权”软件功能丰富、操作便捷,可运行于Windows、Linux、macOS等平台,并且全面适配国产Kunpeng(鲲鹏)生态。

遗传评估是育种的基础,随着基因组育种时代的来临,育种数据规模快速增长,评估算法的计算速度已成为育种中的关键限制因素。遗传评估主要包括方差组分估计及育种值求解两个步骤,其中方差组分估计的计算复杂度高,通常数月或一年更新一次;育种值求解复杂度相对较低,需要日常计算更新。

目前,国际现有育种工具(如丹麦的DMU、美国的BLUPF90、英国的ASReml等)采用的评估算法都是以混合模型方程组(Mixed model equation, MME)为核心,即MME策略,需要求解个体关系矩阵和MME左手项(Left hand side, LHS)的逆矩阵。传统育种利用系谱构建个体亲缘关系矩阵,评估过程涉及的矩阵极其稀疏,FSPAK算法(美国专利)能够以极快速度求解稀疏矩阵LHS的逆矩阵,是基于系谱信息的传统育种计算必不可少的核心程序。然而,随着基因组育种时代的来临,个体亲缘关系矩阵构建逐渐由系谱过渡到基因组信息,关系矩阵及LHS矩阵也相应由全稀疏转变为半稠密或全稠密,FSPAK算法并不适用于稠密矩阵运算,其劣势逐渐显现。

虽然FSPAK团队针对性地做出了优化,例如,推出了能够自动鉴别稀疏及稠密块的FSPAK升级版“YAMS”,以及利用区分核心群和非核心群的方式近似求解基因组个体关系逆矩阵的“APY”策略等,一定程度上提升了数据处理能力,但仍然依赖MME框架,无法避免多次大矩阵的求逆运算。当基因分型个体规模累计到数十万时,MME策略面临计算效率低及内存需求大的双重问题,并不能适应基因组大数据时代的育种计算需求。

为解决这一难题,“天权”首创基于方差协方差V矩阵的“HE+PCG”策略,即利用HE回归法估计方差组分,采用基于V矩阵的PCG迭代法估计育种值(如图2所示),可完全避免遗传评估计算过程中的大矩阵求逆,并且V矩阵的维度(有表型个体数)远低于MME方程的维度(所有个体数×遗传随机效应个数)。因此,无论是计算效率还是内存需求上,“天权”全面优于基于MME策略的现有工具,更适合基因组育种时代的大数据计算。

“天权”软件自2018年初全国畜牧总站组织基因组育种算法交流时启动研发,历经5年,在功能模块、计算性能、用户体验等方面不断升级完善,目前已被来自全球50多个国家的用户使用。“天权”具备丰富的遗传分析功能,包含常用的单性状模型、重复记录模型、多性状模型等,支持环境互作、遗传互作、环境与遗传互作等分析,是目前唯一兼具基因组选种及基因组精准选配功能的育种计算工具。目前,“天权”已在扬翔、中粮、海大、金旭等多个大型农牧企业应用,为我国种猪基因组高效选育,以及三元商品猪生产精准选配提供了国产化新工具。

华中农业大学博士后尹立林和武汉理工大学博士生张浩浩为论文共同第一作者,华中农业大学教授赵书红、刘小磊和李新云为论文共同通讯作者。该研究受到国家重点研发计划青年科学家项目、国家自然科学基金、国家生猪体系岗位科学家项目的资助。(来源:中国科学报 李晨)

HIBLUP(天权)软件下载及使用教程网站见:https://www.hiblup.com

相关论文信息:https://doi.org/10.1093/nar/gkad074

 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
中国超重元素研究加速器装置刷新纪录 彩色油菜花又添7色!总花色达70种
考研复试,导师心仪这样的学生! 地球刚刚经历最热2月
>>更多
 
一周新闻排行
 
编辑部推荐博文