来源:Quantitative Biology 发布时间:2022/8/1 13:32:58
选择字号:
QB | 前沿研究:针对 COVID-19 大流行的基于物理的机器学习模型:八个国家的社交距离遵守和短期预测

论文标题:Physics-informed machine learning for the COVID-19 pandemic: Adherence to social distancing and short-term predictions for eight countries (针对 COVID-19 大流行的基于物理的机器学习模型:八个国家的社交距离遵守和短期预测)

期刊:Quantitative Biology

作者:Georgios D. Barmparis, Giorgos P. Tsironis

发表时间:07 Jul 2022

DOI:10.15302/J-QB-022-0281

微信链接:点击此处阅读微信文章

COVID-19 自2019年报道以来,已在世界范围内迅速蔓延至今。大多数国家最终采用了起源于中国的社交距离规则。一些国家推迟了措施的实施,结果出现了大量感染者和死亡病例。一些国家行动则非常迅速,控制了感染人数。但是,每个国家社交距离保持的程度和速度都不同。

流行病的控制一直是许多研究的主要课题,目前已经使用了几种流行病模型来解决控制措施如何限制流行病增长的问题。最近Quantitative Biology上发表了一篇来自希腊学者们的“Physics-informed machine learning for the COVID-19 pandemic: Adherence to social distancing and short-term predictions for eight countries”的研究性论文(点击文末“阅读原文”下载PDF全文),文章受物理学方法启发,采用人工智能方法分析了 COVID-19 感染数据,从而更清楚地了解感染动态,并有助于预测未来的变化趋势。

全文概要

本文使用机器学习和SIR感染动力学方程从感染数据中提取遵守社会距离的程度,并通过它评估采取强制措施的有效性。文章先从 SIR 模型来推导感染率的微分方程,然后使用物理信息神经网络(PINN)获取感染人口的数据并估计感染率。训练方法是先在SIR 上进行预训练,然后在每个国家报告的感染数据上进行训练。同时,模型将每条感染曲线与一个衰减斜率联系起来,该斜率表示当前措施对感染现象的总体控制。此外,模型可以使用传播第二阶段的数据进行短期预测(图1)。

文章用“第一波”感染数据做训练,将定量机器学习分析应用于八个国家,发现希腊和美国的两个极端措施分别成功和不成功地限制了传播。紧接着用“第二波”感染数据训练网络后,作者提取了与时间相关的感染率,并进行了时长一周及以上的短期预测(图1)。结果表明,该方法适用于所有国家并具有较好的短期预测结果

图1. 模型和结果的总结。

具体方法及结果如下:

1. 通过预先训练的、基于物理的神经网络进行特征提取

数据显示,“第一波”COVID-19在不同国家的不同时间开始,并发生完全不同的演变。在实施了与中国类似的非常严格措施的国家中,疫情传播迅速实现了控制。其他推迟或部分实施措施或基本不采取措施的国家中感染人数较多,而且感染人数的下降速度较慢。

为了进一步了解控制社交距离对八个国家感染人口分布的影响,作者假设SIR 模型可以捕捉每个国家流行病的主要信息,利用特定国家的受感染数据训练了一个物理信息网络并使用它来提取以函数 α(t) 为代表的社会疏离措施的存在和持续性:α(t)=σ0+σt,斜率 σ估计了社会疏离的效率程度。较大的 σ 值描述了一个国家在“第一波”浪潮中采取了严格的社会疏离措施。在提取了每个国家的最优 α(t) 和 μ 之后,通过求解 SIR 模型和拟合真实数据,作者给出了每个国家“第一波”期间的预测病例总数,如图 2 所示。

图2. 每个国家的 α(t) 和感染数预测 I(t)

2. 短期预测

在感染初期,通过 SIR 预训练的模型为不同国家提供了 α(t) 的层次结构。因此,可以尝试将此模型应用于 COVID-19 大流行的当前阶段,从而对未来进行预测。图 3展示了一周的预测结果。从图中可已看出,模型的短期预测能力在大多数国家/地区表现的相当不错。

图3. 使用除上周外的 COVID-19 传播第二阶段的数据训练网络并预测上周的演变。

最后,文章讨论了模型对数据的适应性。当感染率没有迅速变化时,模型可以给出了非常好的短期预测。但当感染率变化非常迅速时,该模型并没有很好的跟随大流行的演变。其次讨论了模型预测的分辨率问题。目前的模型假设的是一个混合良好、基本统一的国家。但是,不同国家、不同地区的行为可能因地理、环境、文化和人口原因而有所不同。因此引入区域数据可以获得更准确的结果。文章提到该方法存在对预测期间感染率的变化较为敏感等局限性,后面可以通过引入更复杂的神经网络架构,比如长短期记忆模型(LSTM)来提高预测的准确性。

Quantitative Biology期刊介绍

Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。

QB期刊目前已被ESCI, Scopus, CSCD等国内外重要数据库收录。

《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中13种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
应激颗粒异常是导致周围神经病的重要机制 “中山大学极地”号顺利完成渤海冰区试航
AI技术从零开始生成原始蛋白质 科学家模拟出末态粒子关联的三维结构
>>更多
 
一周新闻排行
 
编辑部推荐博文