BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation

论文:《BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation》(arXiv 2024)

本文提出了一种创新的u型网络BEFUnet,该网络增强了体特征和边缘特征的融合,以实现精确的医学图像分割

双分支编码器:

image-20240504130415926

  • 边缘编码器:由四个阶段组成,每个阶段包含4个PDC块用于特征检测,并利用最大池化对各阶段之间的特征进行降采样来得到分层特征

    注:PDC块包括一个深度卷积层、一个ReLU层和一个1×1的卷积层

  • 主体编码器:使用Swin-Transfomer对具有全局信息的高级特征进行编码

将提取的边缘和体特征输入到LCAF模块进行融合

LCAF:选择性地将边缘图和主体图进行交叉注意力,来融合边缘和主体的特征

image-20240504131627922

DLF模块:为确保层级之间的特征一致性,使用交叉注意力机制来跨尺度融合信息

较浅的层级包含更精确的定位信息,而较深的层级携带更适合解码器的更多语义信息,考虑到节省计算资源,只将最浅层()和最后一层()进行融合

image-20240504133235606