活细胞内蛋白质冷凝物的荧光显微镜图像。图片来源:Weitz lab, Harvard University
近日,科学家发现,Netflix、亚马逊和Facebook使用的强大算法可以“预测”癌症和阿尔茨海默氏症等神经退行性疾病的生物学语言。
研究人员将数十年研究产生的大数据输入到一个计算机语言模型中,以检验人工智能能否比人类做出更先进的发现。英国剑桥大学圣约翰学院的学者发现,机器学习技术可以解读癌症、阿尔茨海默氏症和其他神经退行性疾病的“生物语言”。
相关论文近日发表于美国《国家科学院院刊》,未来可能用于“纠正导致疾病的细胞内的语法错误”。
该论文第一作者Tuomas Knowles表示:“将机器学习技术引入神经退行性疾病和癌症的研究绝对是一个游戏规则改变者。最终,我们的目标将是使用人工智能开发靶向药物,显著缓解症状或预防阿尔茨海默氏症的发生。”
Netflix能推荐一部连续剧、Facebook推荐某人做朋友,这些平台都使用强大的机器学习算法,对人们接下来会做什么进行猜测。Alexa和Siri等语音助手甚至可以识别单个的人,并与你“交谈”。
研究人员使用类似的机器学习技术训练了一个大规模的语言模型,以观察当体内的蛋白质出现问题导致疾病时会发生什么。“人体是成千上万种蛋白质的家园,而科学家们还不知道其中许多蛋白质的功能。我们要求一个基于神经网络的语言模型来学习蛋白质的语言。”论文共同第一作者Kadi Liis Saar说。
研究人员特别要求该程序学习生物分子冷凝物(细胞中发现的蛋白质液滴)的语言,以破解导致癌症和阿尔茨海默氏症等神经退行性疾病的生物功能和故障语言。他们向算法提供已知蛋白质的所有数据,这样它就可以学习和预测蛋白质的语言。
研究人员表示,机器学习的进一步应用可能会改变未来癌症和神经退行性疾病的研究。科学家的发现可能会超出目前已知和推测疾病的范围,甚至可能超出人类大脑在没有机器学习的帮助下能够理解的范围。(来源:中国科学报 鲁亦)
相关论文信息:http://dx.doi.org/10.1073/pnas.2019053118
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。