科技日报北京11月25日电 (记者刘霞)美国哈佛大学医学院与西班牙巴塞罗那基因组调控中心科学家在24日出版的《自然·遗传学》杂志上发表研究成果称,他们开发出一款名为popEVE的人工智能(AI)模型。该模型能精准锁定人类蛋白质中最易导致疾病的突变,这一突破有望彻底改变遗传疾病的诊断方式。
popEVE的研发基于数十万个不同物种的进化数据及全人类群体的遗传变异信息。庞大的进化记录使该工具能解析约2万多种人类蛋白质的关键区域与可变异区域,从而不仅能识别致病突变,还能对这些突变给人体造成的危害程度进行排序。
每个人的基因组都包含许多微小变异,其中包括改变蛋白质单个氨基酸的“错义突变”。这类突变大多无害,但部分可能引发严重疾病。真正的挑战在于如何区分良性变异与有害变异。此外,有害突变的影响程度也各不相同:有的仅引发轻微症状,有的导致严重残疾,有的甚至在儿童期就危及生命。现有AI工具大多只能预测突变是否危险,却难以评估其危害程度。
更棘手的是,“罕见突变”缺乏病例参考,即使进行全球范围的基因测序,这些突变也往往无迹可寻,依赖患者群体数据的传统方法对此束手无策。
popEVE创新性地将进化数据与英国生物库、基因组聚合数据库两大资源库相结合。通过分析健康人群中存在的基因变异,该模型得以校准对人类疾病的预测。这使科学家首次建立起能对全蛋白质组突变进行危害排序的模型,可帮助医生优先关注破坏性最强的变异。
为验证模型效能,团队分析了超过3.1万个患有严重发育障碍的儿童家庭遗传数据。在98%的病例中,popEVE将共同突变标记为最具破坏性的变异,其表现优于包括“深度思维”公司AlphaMissense在内的同类先进工具。而且,在探寻新的致病基因时,popEVE发现了123个此前被认为与发育障碍无关的基因,其中104个仅在个别病例中出现。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。