|
|
FASE 中南大学刘辉教授团队—用于苹果叶部病害识别的改进型多尺度融合密集网络及高效多尺度注意力机制 |
|
论文标题:Potential unreliability of ALK variant allele frequency in the efficacy prediction of targeted therapy in NSCLC
期刊:Frontiers of Agricultural Science & Engineering
作者:Wei Rao, Yutao Liu, Yan Li, Lei Guo, Tian Qiu, Lin Dong, Jianming Ying, Weihua Li
发表时间:15 Jun 2023
DOI:0.1007/s11684-022-0946-x
微信链接:点击此处阅读微信文章

智慧农业
Smart Agriculture
专 辑 文 章 介 绍
· 第一篇 ·
▎论文ID
An improved multiscale fusion dense network with efficient multiscale attention mechanism for apple leaf disease identification
用于苹果叶部病害识别的改进型多尺度融合密集网络及高效多尺度注意力机制
文章类型:Research Article
发表年份:2025年
第一作者:戴丹丹
通讯作者:刘辉
Email: csuliuhui@csu.edu.cn
作者单位:中南大学
Cite this article :
Dandan DAI, Hui LIU. An improved multiscale fusion dense network with efficient multiscale attention mechanism for apple leaf disease identification. Front. Agr. Sci. Eng., 2025, 12(2): 173–189 https://doi.org/10.15302/J-FASE-2024583
· 文 章 摘 要 ·
随着智慧农业的发展,运用视觉识别技术替代人工肉眼来精确识别作物病害成为一个重大挑战。本研究聚焦于与苹果最终产量密切相关的苹果叶部病害,开发了一种结合高效多尺度注意力 (EMA) 机制的多尺度融合密集网络Incept-EMA-DenseNet,以更好地识别八种复杂的苹果叶部病害图像。Incept-EMA-DenseNet由三个关键部分组成:在浅层特征提取层中用多尺度融合方法替代卷积层的初始模块;用于获取不同密集块适当权重的EMA机制;基于DenseNet121改进的密集网络。具体而言,首先,为找到合适的多尺度融合方法,本研究对残差模块和初始模块进行了比较以确定每种技术的性能,Incept-EMA-DenseNet达到了95.38%的准确率。其次,该研究使用了三种注意力机制,其中高效多尺度注意力机制表现最佳。第三,在不降低性能的情况下对卷积层和瓶颈进行了修改,与原始模型相比,计算负荷减少了一半。本文提出的Incept-EMA-DenseNet准确率为96.76%,分别比Resnet50、DenseNet121和GoogLeNet高2.93%、3.44%和4.16%,证明其可靠且有益,能够有效便捷地帮助果农在田间识别苹果叶部病害。
· 文 章 亮 点 ·
1. 提出了一种具有EMA机制的多尺度融合密集网络用于苹果叶部病害识别。
2. 用多尺度融合替换浅层特征提取层,并比较两种不同多尺度方法的性能。
3. 根据三种注意力机制的比较结果,将EMA机制集成到模型中。
4. 基于DenseNet121提出了一种改进的密集网络,减少了一半的参数。
· Graphical abstract ·

· 研 究 内 容 ·
▎引言
农业是重中之重,全球约有8.66亿人依靠农业为生,其构成了全球劳动力的25%以上。然而,自2000年以来,农业劳动力令人担忧地减少了16%,导致农田弃耕现象增多。这种转变提出了一个关键问题,即如何在最小化劳动力投入的同时优化土地利用。作为回应,自动化农业机械应运而生。然而,随着技术革命和产业转型,当前的机械化农业无法满足现代社会的发展需求,这意味着智慧农业是一个重要的议题。随着工业4.0技术在农业中的应用,越来越多的研究人员主张使用机器视觉技术来应对该领域的各种挑战,包括水果和植物计数、作物生长和健康监测,尤其是病虫害评估。过去,病虫害评估依赖于经验丰富的操作人员进行目视检查,这既耗费时间,又让农民难以承受。相比之下,随着图像识别技术的出现,这些挑战现在可以更高效、更有效地得到解决。
在众多农业产品中,苹果是全球最受欢迎的水果之一,全球约有500万公顷的土地用于种植苹果,2017年苹果产量为8300万吨。然而,叶部病害是影响苹果产量的一个严重问题,精准识别其病因需要经验和专业知识,因此如何利用视觉智能来识别影响叶片的病害原因是一个关键问题。借助视觉技术,农民可以使用简单方便的照片识别,而不必花钱大费周章的寻找专家。
▎数据处理
研究数据是从包括八种苹果叶部病害,即链格孢叶斑病、褐斑病、蛙眼病、灰斑病、花叶病、白粉病、锈病和疮痂病,以及健康叶片作为对照 (图1)。这些图片是在两种背景下拍摄的,具有复杂环境干扰的户外场景和简单的实验室环境,这有助于在实际应用场景中展示更好的泛化性能。然而,关于四种叶片 (链格孢叶斑病、褐斑病、灰斑病和花叶病) 的数据相对稀缺,这很可能影响模型的学习和泛化能力,因此需要扩展数据集。本文对比了许多图像增强技术,如数据裁剪、旋转和镜像,以及降低图像的亮度和暗度可以提高模型性能。然而,亮度和暗度的变化会对相似苹果叶部病害的区分产生负面影响。所以,本研究主要使用旋转和镜像来扩展图像数据集。然后,将图像插值到224 × 224像素,并将数据按7:2:1的比例分为训练集、验证集和测试集,以方便模型训练。根据增强数据集和小型数据集之间的对比实验结果,DenseNet121、ResNet50和GoogLeNet在原始数据集上的准确率分别为91.93%、90.13%和88.86%。相比之下,扩展数据集的准确率分别为93.32%、93.83%和92.60%,分别提高了1.39%、3.7%和3.74%,这表明扩展后的数据集可以提供更好的性能。

图1 八种常见苹果叶病害及健康叶片的对比图。
▎模型框架
本研究开发了一种用于苹果叶部病害分类的增强卷积神经网络,它由三部分组成:初始模块 (Inception module)、高效多尺度注意力 (EMA) 机制和密集连接网络模型 (图2)。此模型是 DenseNet121的改进版本,保留了瓶颈层 (bottleneck) 和过渡层 (transition) 交替运作的基本框架,以确保模型的简洁性和明确性。与AlexNet和GoogLeNet相比,开发的瓶颈层采用了批量归一化技术,确保了各层输入分布相对稳定,通过对每层输入进行归一化,加快了网络训练过程的收敛速度。在瓶颈层的3 × 3卷积层之前,还使用了内核大小为1 × 1的卷积层,用于调整通道数量,有效减少了输出特征图的数量、模型参数以及计算复杂度。其中,DenseNet的关键特征是连接机制,每个瓶颈层的输出沿着通道维度与输入进行连接。初始7 × 7卷积层用初始模块代替,在堆叠的瓶颈层后添加注意力机制,构成整体的模型框架。

图2 模型框架及检测流程图。
▎研究结果与讨论
1. 数据增强提供足够样本
实验表明在标准网络中,ResNet50、DenseNet121和GoogLeNet的准确率达到了90%以上,这意味着苹果叶部病害的增强数据集包含了足够且相关的样本,能够准确反映出存在的特征和变化。此外,在整合了随时间呈指数下降的可变学习率后,所有评估模型的收敛速度都加快了,并且这些模型在大约50个周期时趋向于达到稳定的平衡状态。同时,可能导致在训练集上表现强劲但在测试集上泛化能力差的振荡现象显著减少。这使得模型在应用于实际情况时能够提供更一致的预测性能。
2. 多尺度模块增强特征信息提取
在残差模块和初始模块的消融实验显示,与原始的7 × 7卷积层相比,初始模块和残差模块都增强了感受野 (图3),为图像的浅层提取提供了不同的核大小,在不忽略全局信息的情况下显著提高了模型的准确性。此外,该实验表明,用多尺度方法替代单个卷积层可以增强模型捕捉多种特征的能力。值得注意的是,初始模块的计算量不到残差模块的一半,但却具有更高的准确性和精度,这可能归因于其对通道的分散和整合。不同核大小卷积层的不同通道权重有助于模型更好地学习局部详细信息和全局信息。

图3 初始模块 (左) 和残差模块 (右) 结构对比图。
3. 注意力机制提高模型性能
三种注意力机制提高了模型性能,因为它们都考虑了通道信息,为每个密集块的输出提供了自适应权重。然而,复杂的注意力机制可能导致模型退化,并增加调整每个注意力分支参数的难度,这将使模型难以实现令人满意的预测。因此,尽管三重注意力融合了时间、空间和通道注意力,但它的性能比其他两种注意力机制差。总体而言,由于高效多尺度注意力机制结合了来自多个尺度的图像特征,增强了模型在不同尺度上提取信息的能力,因此该注意力机制表现出更好的性能 (图4)。

图4 高效多尺度注意力机制 (左) 和高效通道注意力机制 (右) 对比图。
· 结 论 与 展 望 ·
本研究提出了一种新型模型Incept-EMA-DenseNet,它将多尺度融合模块与EMA机制相结合。该模型由多尺度浅层特征提取、应用于密集块的注意力机制以及增强的DenseNet架构组成。这个新的综合模型能够通过卷积层的不同核大小提取详细的局部和全局信息。其EMA机制在计算负载增加很少的情况下融合了空间信息和通道信息。与DenseNet121相比,DenseNet的框架也得到了改进,节省了大量的计算时间。在这项工作中,通过三个对比实验评估了模型的准确性和性能,Incept-EMA-DenseNet在识别健康苹果叶和八种常见叶病方面的准确率为96.76%,分别比Resnet50、DenseNet121和GoogLeNet高2.93%、3.44%和4.16%。此外,还对不同的多尺度融合方法和注意力机制进行了评估,确定Incept-EMA-DenseNet为最适合苹果叶部病害分类且表现最佳的网络模型。接下来的工作可以聚焦于更丰富更复杂的数据集,将模型对象扩展到其他农作物上,以获得同样优秀的识别结果,助力于用视觉技术预防与检测农作物的病害,为智慧农业添砖加瓦。
【作者及团队介绍】

刘 辉
中南大学二级教授、教育部长江学者特聘教授、升华学者领军岗教授,长期从事人工智能及机器人智能装备关键技术研究。入选全球高被引科学家、中国工程院“中国工程前沿杰出青年学者”、英国皇家工程院“杰出国际工程师奖”。获中德双博士学位、德国教授文凭 (机器人),曾任德国联邦教育与研究部冠名BMBF Junior Group Leader、德国生命科学自动化重点实验室机器人研究所所长。以第一完成人获世界互联网大会领先科技奖、施普林格-自然“中国新发展奖”、教育部技术发明二等奖、教育部自然科学二等奖、吴文俊人工智能科技奖等奖励,参与获国家科技进步一等奖。

戴丹丹
刘辉教授团队成员,中南大学研究生,就读于交通运输工程专业,研究方向为视觉-信息融合技术在农业机械中的应用、电力系统及其自动化。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。