|
|
健康研究相互矛盾 AI出手“了断纷争” |
北京大学研究团队找到矛盾证据高效整合新方法 |
“多吃盐”还是“少吃盐”;“胖一点好”还是“瘦一点好”;某项锻炼是否有效……生活中,我们常听到关于饮食、运动和健康的各种“建议”。很多建议经过严谨的研究,发表于“顶刊”,但结论却众说纷纭,甚至相互矛盾,让人无所适从。
近日,北京大学医学部助理教授杜建团队在《自然-通讯》发表论文,提出利用大语言模型(LLM)实现“证据三角测量”,从而高效、客观地整合不同来源的研究结论,为处理医学证据矛盾、进行科学决策开辟了新路径。
AI制图。
?
研究方法不同带来结论差异
“很多严谨的科学研究却出现相互矛盾的结论,是因为医学研究类型多样所致。”杜建告诉《中国科学报》,“健康研究有很多方法,如观察性研究、随机对照试验、孟德尔随机化等,这些方法在设计原理、适用场景和论证强度上各有特点,这往往造成研究结论存在差异。”
不同的研究方法各有优势,但也有着潜在偏差。比如观察性研究以观察人群的生活习惯和健康结果为主;随机对照试验会严格控制变量进行实验;而孟德尔随机化研究注重利用基因差异推断因果关系等。
“如果不同研究设计得出的结论一致,那么这种结论的可信度就更高。”杜建解释说,“这就是我们‘证据三角测量’(Evidence Triangulation Analysis,ETA)的基本思想。”
人工智能扮演“证据裁判”
证据三角测量的想法很好,但医学健康文献浩如烟海,依靠人工查找和总结文献,不仅耗时耗力,而且容易受研究者主观判断影响。
“以往,整合这些证据依赖研究人员手工检索和比对文献,需要大量阅读、筛选、记录、比较不同类型的文献,不仅费时、费力、效率低下,还容易受到研究者影响,缺乏可扩展的自动化方法。”该论文共同作者、北京大学医学部博士生史轩宇说。
为此,研究团队设计出一套基于人工智能的两步流程。
首先,使用大语言模型自动从科学文献中识别出“暴露因素”(如高盐摄入)和“健康结局”(如血压变化),并判断它们之间的关系方向及其显著性。随后,系统对不同研究设计所得到的证据进行一致性量化分析,自动计算出“证据收敛方向”和“收敛性水平”,以此评估各类研究是否指向同一结论。
研究团队以“盐摄入与健康结局”这一经典争议为例,从不同研究设计(观察性研究、随机对照试验、孟德尔随机化研究等)中提取相关数据,并计算了证据收敛水平(一系列数值或函数接近某个值或某个函数的过程)。结果显示,多数证据指向“高盐摄入会升高血压”,且收敛性水平达到“强”这一等级;在盐摄入与心血管疾病及死亡风险的关系上,结果倾向于增加风险,但收敛性相对较弱。
“这说明在‘盐与血压的关系’上,观察性研究、随机对照试验和孟德尔随机化结果高度一致,均支持‘高盐升高血压’。但在盐与心血管疾病或死亡风险的关系上,不同研究类型的结论一致性较低,目前仍存争议,需更多研究,如更好地控制混杂,更好的研究设计等。”杜建说。
该方法能在几分钟内自动化处理成千上万篇文献,并实现证据图谱的动态更新。这不仅突破了传统Meta分析(比较和针对同一科学问题研究结果的统计学方法,常用于医学、心理学、教育学领域)对同类研究的依赖,还能整合不同来源的研究证据,从“结论方向”收敛性随时间动态变化的角度,增进人们对某问题的整体理解。
为解决健康领域“纷争”提供新工具
“该研究的优势不仅在于效率的提升,更在于其系统性和透明度。”该论文共同作者、北京大学医学部博士后赵文静说,它能帮助我们更清晰地识别,当观察性研究与随机对照试验结论一致时,因果关系更为可靠;而当各类研究出现分歧,则提示某些研究可能存在偏差或混杂因素,这也为后续研究指明了方向。
该方法适用于多个现实场景,如辅助临床指南制订、支持公共卫生决策、提高科普宣传的准确性,甚至帮助研究人员快速定位争议焦点,优化研究设计。
“面对相互矛盾的健康信息时,我们不应盲从某项单一类型的研究,而应关注其背后是否有来自多重方法、多角度验证的证据支持。随着人工智能技术在证据整合中的深入应用,一个更加高效、稳健的科学证据分析体系正在形成。”杜建说,“这为解决健康领域长期存在的研究结论冲突,科学规划新的研究,进而减少研究浪费等提供了新工具。”
“这项研究设计非常巧妙,通过证据三角来解决循证医学面临的实践痛点,对循证医学的理论发展有非常积极的意义。”海军军医大学第三附属医院概念验证(成果转化)中心主任徐畅说。
相关论文信息:https://doi.org/10.1038/s41467-025-62783-x
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。