BEFUnet:A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation

BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation

论文：《BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation》（arXiv 2024）

本文提出了一种创新的u型网络BEFUnet，该网络增强了体特征和边缘特征的融合，以实现精确的医学图像分割

双分支编码器：

边缘编码器：由四个阶段组成，每个阶段包含4个PDC块用于特征检测，并利用最大池化对各阶段之间的特征进行降采样来得到分层特征

注：PDC块包括一个深度卷积层、一个ReLU层和一个1×1的卷积层
主体编码器：使用Swin-Transfomer对具有全局信息的高级特征进行编码

将提取的边缘和体特征输入到LCAF模块进行融合

LCAF：选择性地将边缘图和主体图进行交叉注意力，来融合边缘和主体的特征

DLF模块：为确保层级之间的特征一致性，使用交叉注意力机制来跨尺度融合信息

较浅的层级包含更精确的定位信息，而较深的层级携带更适合解码器的更多语义信息，考虑到节省计算资源，只将最浅层（ $P^l$ )和最后一层（ $P^s$ )进行融合