YOLO11 改进 – 注意力机制 _ ECA (Efficient Channel Attention) 高效通道注意力:轻量级设计实现跨通道交互,增强特征表征能力

前言

本文介绍了Efficient Channel Attention(ECA)模块及其在YOLOv11中的结合应用。ECA模块是一种新颖的通道注意力机制,通过快速的1D卷积操作生成通道注意力,在不减少通道维度的情况下捕获跨通道交互,且1D卷积核大小可根据通道维度自适应确定。该模块以轻量方式实现有效通道注意力,能在降低模型复杂性的同时保持性能。我们将ECA模块集成进YOLOv11。实验表明,ECA模块在图像分类、目标检测和实例分割等任务中效率更高,性能优于同类方法。

文章目录: YOLOv11改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLOv11改进专栏

文章目录

[TOC]

介绍

摘要

近期研究表明,通道注意力机制在深度卷积神经网络性能优化方面展现出显著潜力,然而现有方法普遍倾向于开发复杂度更高的注意力模块以追求性能提升,这不可避免地导致模型复杂度的显著增加。针对性能与复杂度之间的权衡挑战,本文提出了一种高效通道注意力(ECA)模块,该模块仅需引入少量额外参数即可实现显著的性能增益。通过对SENet中通道注意力机制的深入分析,我们通过实验验证了避免维度缩减操作对于通道注意力学习的重要性,并证明适当的跨通道交互策略能够在显著降低模型复杂度的同时维持优异的性能表现。基于此发现,我们设计了一种无需维度缩减的局部跨通道交互方案,该方案可通过一维卷积操作高效实现。进一步地,我们开发了一种自适应选择一维卷积核尺寸的方法,用于确定局部跨通道交互的有效覆盖范围。所提出的ECA模块在效率与效能方面均表现出色,以ResNet50主干网络为例,该模块仅增加80个参数和4.7e-4 GFLOPs计算量(相较于基线模型的24.37M参数和3.86 GFLOPs),同时实现Top-1分类准确率超过2%的提升。我们在图像分类、目标检测及实例分割等多个任务上,采用ResNets和MobileNetV2作为主干网络对ECA模块进行了全面评估,实验结果表明该模块在保持更高计算效率的同时,性能表现显著优于同类方法。

文章链接

论文地址: 论文地址

代码地址: 代码地址

基本原理

  • ECA-Net(Efficient Channel Attention Network)是一种新颖的通道注意力机制,旨在通过最少的额外参数和计算成本来增强深度卷积神经网络(CNN)的性能。以下是关于ECA的一些关键点:

    1. 高效的通道注意力模块 :ECA模块通过快速的1D卷积操作生成通道注意力。与一些现有的复杂设计的注意力机制不同,ECA以极其轻量的方式实现了有效的通道注意力 。

    2. 局部跨通道交互 :ECA在不减少通道维度的情况下捕获跨通道交互。这种方法使ECA能够学习有效的通道注意力,同时保持轻量级模型 。

    3. 自适应核大小 :ECA中1D卷积的核大小可以根据通道维度的非线性映射自适应确定。这种自适应核大小的选择有助于有效地捕获局部跨通道交互 。

    4. 性能提升 :ECA-Net已被证明在诸如图像分类和目标检测等任务中优于基线模型如ResNet。例如,ECA-Net50在Top-1准确率上比ResNet-50提高了2.28%,同时额外参数和计算量极少 。

    5. 模型复杂性 :尽管性能提升,ECA-Net的模型复杂性低于其他最先进的CNN架构,如ResNeXt和DenseNet。这使得ECA成为各种CNN模型的有前景的补充 。

    6. 泛化能力 :ECA-Net在目标检测和实例分割等任务中展现出良好的泛化能力。其轻量级设计和高效性使其成为改善不同CNN架构性能的有价值选择 。

核心代码

import torch
from torch import nn
from torch.nn.parameter import Parameter

class eca_layer(nn.Module):
    """构建一个ECA模块。

    Args:
        channel: 输入特征图的通道数
        k_size: 自适应选择的卷积核大小
    """
    def __init__(self, channel, k_size=3):
        super(eca_layer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.conv = nn.Conv1d(1, 1, kernel_size=k_size, padding=(k_size - 1) // 2, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        # 在全局空间信息上的特征描述符
        y = self.avg_pool(x)

        # ECA模块的两个不同分支
        y = self.conv(y.squeeze(-1).transpose(-1, -2)).transpose(-1, -2).unsqueeze(-1)

        # 多尺度信息融合
        y = self.sigmoid(y)

        return x * y.expand_as(x)

实验

脚本

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
#     修改为自己的配置文件地址
    model = YOLO('/root/ultralytics-main/ultralytics/cfg/models/11/yolov11-ECA.yaml')
#     修改为自己的数据集地址
    model.train(data='/root/ultralytics-main/ultralytics/cfg/datasets/coco8.yaml',
                cache=False,
                imgsz=640,
                epochs=10,
                single_cls=False,  # 是否是单类别检测
                batch=8,
                close_mosaic=10,
                workers=0,
                optimizer='SGD',
                amp=True,
                project='runs/train',
                name='ECA',
                )

结果

THE END