来源:Frontiers of Environmental Science & Engineering 发布时间:2024/3/28 12:20:59
选择字号:
FESE  在线机器学习实现突发事件下污水量的预测

论文标题:Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies

期刊:Frontiers of Environmental Science & Engineering

作者:Pengxiao Zhou, Zhong Li, Yimei Zhang, Spencer Snowling, Jacob Barclay

发表时间:15 Dec 2023

DOI:10.1007/s11783-023-1752-7

微信链接:点击此处阅读微信文章

提 要

本研究利用在线学习模型对加拿大两个污水处理厂的进水量进行预测。在线学习模型能够有效地预测不断变化的数据模式,并且适用于处理大量的数据流。本研究有助于在新冠疫情、极端天气等突发事件下提供可靠的决策支持,使污水处理和管理更加高效(图1)。

图1 摘要图

研 究 概 览

进水流量的准确预测对于污水处理厂的运行和管理至关重要,因为其与污水的生化需氧量、总悬浮固体和pH等特性密切相关。传统的批处理监督学习可以有效预测进水流量,但并不适合于因新冠肺炎或其他突发事件影响而输入—输出关系发生动态变化的场景。本研究创新性地提出了三种具有代表性的在线机器学习模型,并将其结果作集成处理,用于优化流量预测。通过这一方法,我们成功实现了由新冠肺炎疫情导致的污水产生模式变化下的污水流量预测。

在线机器学习是一种高效的机器学习算法,在数据持续到达、应用规模庞大、以及数据生成模式及规律不断变化的情况下,它具有明显的优势。本研究选择了加拿大安大略省的两个污水处理厂 (A和B) 进行案例研究,收集了包括进水流量在内的多个相关变量的数据。数据涵盖了新冠疫情前后的连续观测数据,以反映不同的操作和环境等条件。这些数据被用于训练和评估批处理学习和在线学习模型的性能 (Adaptive Random Forest, aRF; Adaptive K-Nearest Neighbors, aKNN; Adaptive Mult-Layer Perceptron, aMLP),为后续的模型比较和分析提供了基础(图2)。

图2 测试数据集上各模型进行预测的散点图:(a) A厂的在线学习模型,(b) A厂的批量学习模型,(c) B厂的在线学习模型,以及(d) B厂的批量学习模型。

通过比较不同模型的决定系数 (R2)、平均绝对百分比误差 (MAPE) 和均方根误差 (RMSE),发现在线机器学习模型在几乎所有情况下都表现更好,具有更高的准确性和更低的误差。对在线学习和批量学习的性能进行比较 (图3),发现在线学习模型能够实时地适应数据的变化和新的观测数据,能够更好地应对突发事件和数据模式的变化,以提供更准确的预测。相比于批量学习模型,在线学习模型具有更高的效率和灵活性,能够在短时间内处理大规模的进水数据流。

图3 在线学习方法和批量学习方法的性能比较:(a) 工厂A的预测误差直方图,(b) 工厂A的预测误差的框图,(c) 工厂B的预测误差的直方图,以及 (d) 工厂B的预测误差的框图。

通过对比不同在线机器学习方法在不同数据情况下的表现 (图4),发现这三种在线机器学习方法均能有效捕捉两厂的流量分布。A厂流量呈双峰分布,B厂流量则遵循泊松分布,这可能与A厂数据反映出的季节性变化有关。性能评估显示,在线机器学习aMLP模型最适合A厂,在线机器学习aKNN模型最适合B厂,而在线机器学习aRF模型在所有情况下均表现出最高的稳定性。

图4 在线学习方法的性能比较:(a) 工厂A的预测直方图,(b) 工厂A的预测框图,(c) 工厂B的预测直方图,以及 (d) 工厂B的预测的框图。

将多个在线学习模型的预测结果进行加权平均,形成了集成模型。研究发现,集成模型能够综合利用多个方法的优势,进一步减少误差并提高预测准确性,在预测污水处理厂进水流量方面具有更好的性能 (图5)。此外,通过不确定性分析,研究确定了最佳的集成权重,以进一步改善集成模型的预测性能。通过调整权重,可以根据各个在线学习方法的表现情况来调整其在集成模型中的贡献,以达到最佳的预测效果。

图5 (a) 工厂A和 (b) 工厂B的平均在线学习预测与观测的散点图

综上,在线学习模型在预测进水流量方面比传统的批量学习模型表现更好,并且具有更高的适应性和预测能力。通过对两个加拿大污水处理厂的实际案例进行比较,发现在线学习模型在所有情景下都达到了最高的预测性能。此外,通过不确定性分析,确定了最佳的预测策略。因此,本文提出的在线学习模型能够为污水处理厂在应对突发事件时提供支持,并为运营和管理决策提供可靠的依据。

扫码或点击“Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies”获取文章原文

本文内容来自FESE期刊2023年第17卷第12期发表的Research article文章“Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies”。通讯作者为麦克马斯特大学Zhong Li 教授和华北电力大学张一梅教授。

引用格式:Pengxiao Zhou, Zhong Li, Yimei Zhang, Spencer Snowling, Jacob Barclay. Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies. Front. Environ. Sci. Eng., 2023, 17(12): 152

本文来自Special issue—Artificial Intelligence/Machine Learning on Environmental Science & Engineering

相关阅读

FESE研究 | 分子模拟+机器学习 大规模筛选用于碘捕获的金属有机框架材料

FESE研究 | 深度学习框架精准预测室内空气质量

FESE研究 | 机器学习预测核黄素介导污泥发酵VFA最大产量

会议通知|第四届环境科学与工程前沿青年论坛

声明:本文为FESE期刊编辑部与青年编委会、作者等共同制作,内容仅供参考。欢迎转发和阅读原文,并就文章提出广泛讨论。如转载,请保持内容完整、标注信息来源。

期刊简介

FESE

Frontiers of Environmental Science & Engineering是由高等教育出版社、中国工程院和清华大学共同主办的环境领域综合学术期刊,聚焦环境领域前沿问题与研究成果,重点关注开创性、跨学科的研究,致力于打造具有国际影响力的高水平学术交流平台,是中国工程院院刊系列期刊、中国科技期刊卓越行动计划重点期刊。

主编:曲久辉院士,John Crittenden院士

期刊官网1(国内免费获取)

http://journal.hep.com.cn/fese

期刊官网2

www.springer.com/journal/11783

欢迎关注

《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
大规模基因研究重绘开花植物的生命之树 彭慧胜院士团队把“充电宝”做成衣服
缓解肠易激综合征  饮食比服药更有效 银河系发现巨大黑洞
>>更多
 
一周新闻排行
 
编辑部推荐博文