水稻DNA调控元件数据库RiceENCODE的框架结构 华中农大供图
水稻的染色质交互远程网络和浏览器截图 华中农大供图
人类的疾病和动植物的表型性状,都与该物种的基因正确表达密切相关。而基因的表达不完全由基因的DNA序列决定,而是同时与DNA调控元件的调控息息相关。
近日,《分子植物》(Molecular Plant )在线发表了华中农业大学教授李国亮和李兴旺团队联合发表的题为最新研究论文。他们报道了一个整合水稻多元表观基因组数据的数据库,全面盘点了水稻基因转录调控的“零件库”。
调控元件百科全书计划
论文共同通讯作者李国亮介绍,2003年提出并实施的人类ENCODE计划(DNA调控元件百科全书计划)通过整合DNA、RNA和表观修饰等多个层面的数据建立了多组学的人类基因组DNA调控元件数据库,注释了人类基因组中数以百万计的DNA调控元件,增强了我们对人类功能基因组的理解。同时,ENCODE计划的一系列技术和成果,为后续人类或模式生物基因调控的功能挖掘提供了极大帮助和支持。
水稻是我国乃至世界重要的粮食作物,同时也是基础研究的重要模式植物。“水稻基因组DNA顺式调控元件的注释和鉴定,对理解水稻基因表达调控机理有重要意义。”论文共同通讯作者李兴旺说,因此,一个整合了水稻多元表观基因组数据的数据库,将极大地方便研究人员查询和分析水稻的表观遗传信息,促进水稻表观和三维基因组研究。
李国亮说,基因的正确表达,相当于一个机器的正常运行,需要各个零件的正常工作。而水稻基因表达涉及多少零件,以前的知识是零散的。
该数据库基于团队此前发表的水稻20个品系参考表观基因组图谱(https://www.nature.com/articles/s41467-020-16457-5)和水稻高分辨率三维基因组结构数据 (https://www.nature.com/articles/s41467-019-11535-9),收集了公开发表的水稻多品种多组织多维度的表观基因组信息,展示了水稻不同类型的染色质调控元件,立体地呈现了水稻品种和组织间复杂的基因表达调控关系。
“这是参照人类ENCODE计划,推进水稻功能基因组研究的重要一步。”李国亮说。
最完整的“零件库”
该数据库收集了包括ChIP-seq, ATAC-seq, MNase-seq, FAIRE-seq, BS-seq, RNA-seq, ncRNA-seq, Hi-C和ChIA-PET 等共计972套水稻高通量组学数据,通过标准化的数据处理流程,得到了多维度的高质量表观基因组和三维基因组数据。
研究者构建了综合的数据库搜索页面,用户可在数据库的基因组浏览器中查看不同品种、多种组织的表观基因组数据。用户可根据自己需求,选择不同类型的表观基因组数据,查询目标区域或目标基因的表观修饰信息。该数据库还提供了大量结果数据信息,这些数据文件都可在下载页面下载。用户可根据自己的需要进行下游分析。
另外,该数据库引入了水稻三维基因组数据。用户不仅可以查询目标区间参与的所有染色质远程交互信息,还可查询两两基因之间拥有的多层级交互基因网络,为水稻多基因之间共转录、共调控提供参考。
该数据库全面展示了多维度水稻表观基因组数据,涵盖了水稻不同品系不同组织间的表观基因组动态变化模式,为水稻功能基因组研究领域提供了解析水稻表观基因组和染色质远程互作信息的重要研究平台。
李兴旺解释说,该数据库相当于发布了水稻基因转录调控的“零件库”,方便大家在研究中选取合适的零件,组成基因表达的机器,正确表达相关基因。打个形象的比方即相当于乐高中的零件,现在整理出来一个最完整的“零件库”和相对完整的“零件列表”,大家可选择自己想要的零件,组装自己想要的机器。
该研究得到国家重点研发计划,国家自然科学基金和华中农业大学自主科技创新基金的支持。
相关论文信息:https://doi.org/10.1016/j.molp.2021.08.018
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。