【图像超分】论文精读:CFAT: Unleashing Triangular Windows for Image Super-resolution
第一次来请先看这篇文章:【超分辨率(Super-Resolution)】关于【超分辨率重建】专栏的相关说明,包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等)
文章目录
前言
Abstract
1. Introduction
2. Related Works
2.1. CNN Based Super-Resolution
2.2. Vision Transformer (ViT) Based SR
3. Proposed Method
3.1. Overall Architecture
3.2. Head Module - Shallow Feature Extractor:
3.3. Body Module - Deep Feature Extractor:
3.3.1 Dense Window Attention Blocks (DWAB)
3.3.2 Sparse Window Attention Block (SWAB)
3.3.3 Tail Module - HQ Image Reconstruction
4. Triangular Window Technique
5. Experiments
5.1. Datasets and Performance Matrices
5.2. Experimental Settings
5.3. Ablation Study
5.3.1 Impact of Various Model Hyperparameters :
5.3.2 Impact of CWAB :
5.3.3 Impact of Triangular and Rectangular Windows:
5.4. Comparisons with State-of-the-art Methods
6. Conclusion
7. Supplementary
7.1. Extensive Model Analysis
7.2. Extensive Ablation Study
7.3. Extended Comparison with SOTA Architectures
前言
论文题目:CFAT: Unleashing Triangular Windows for Image Super-resolution —— CRAFT:用于图像超分辨率的展开三角窗口
论文地址:CFAT: Unleashing Triangular Windows for Image Super-resolution
论文源码:https://github.com/rayabhisek123/CFAT
CVPR 2024!
Abstract
基于 Transformer 的模型通过利用它们捕获复杂上下文特征的固有能力彻底改变了图像超分辨率 (SR) 领域。如今,变压器架构中使用的重叠矩形移位窗口技术是超分辨率模型中提高图像放大质量和稳健性的常见做法。然而,它在边界处存在失真,并且具有独特的移位模式。为了克服这些缺点,我们提出了一种非重叠三角形窗口技术,该技术与矩形窗口同步工作以减轻边界级失真,并允许模型访问更多独特的筛选模式。在本文中,我们提出了一种复合融合注意转换器(CFAT),它将基于三角矩形窗口的局部注意与图像超分辨率中基于通道的全局注意技术相结合。因此,CFAT 使注意力机制能够在更多的图像像素上被激活,并捕获远程多尺度特