近日,暨南大学大数据决策研究所教授胡勇指导团队包括博士后罗启超、硕士生顾钰良等人围绕充分利用结构数据的特征信息和蛋白-配体相互作用的先验知识,建立高效准确的亲和力预测模型。相关原创性成果发表于Cell子刊《交叉科学》(iScience)。
该研究是基于新一代人工智能技术积累与医疗领域大数据关键问题相结合的跨领域大科学大交叉研究。当前基于深度学习的方法忽略了蛋白质和配体结构数据的边信息,并且基础的注意力机制难以捕获蛋白质和配体结构小数据集中的蛋白-配体结合相互作用知识,导致预测的准确度有限。
胡勇团队提出了基于超边图卷积和多监督注意力模块的原创性算法框架SEGSA_DTA,有效地融合节点和边的特征信息,生成更全面的特征表示,同时缓解结构数据不足和注意力机制分布学习低效的问题。
研究结果显示,SEGSA_DTA在基准数据集以及其他多个数据集上均取得了先进水平,充分说明了该框架相对于目前深度学习方法的普遍优势。SEGSA_DTA具有良好的模型可解释性,结合SHAP方法为指导基于结构的先导化合物优化提供了一个新的定量分析解决方案,服务于药物研发。
该论文共同通讯作者、合肥医科大学副教授罗启超表示,SEGSA_DTA可用于加速新冠药物的发现,SEGSA_DTA通过针对新冠病毒主蛋白酶SARS-CoV-2 Mpro的药物重定位,提供了一批可能的潜在治疗药物,其中部分药物已被报道具有潜在的抑制活性。
据了解,该研究主要解决人工智能辅助药物研发这一领域关键难题。蛋白-配体结合亲和力预测是药物研发早期阶段最为关键的任务之一,其预测的准确度直接决定药物研发的成功率,是药物研发所有后期阶段的基石。
胡勇团队在新一代人工智能方面有超过10年的积累。他们在迁移学习、个性化建模、因果学习、联邦学习、增强学习、智能集成决策领域有深入研究,形成团队自主创新的新一代人工智能算法体系。其团队愿景是“做正确事,成为AI赋能领先者”。
相关论文信息:https://www.cell.com/iscience/fulltext/S2589-0042(22)02165-4
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。