
讯享网
这篇文章网络结构ESRT( Efficient Super-Resolution Transformer)还是蛮复杂的,是一个CNN和Transformer结合的结构。文章提出了一个高效SRTransformer结构,是一个轻量级的Transformer。作者考虑到图像超分中一张图像内相似的细节部分可以作为参考补充,(类似于基于参考图像Ref的超分),于是引入了Transformer,可以在图像中建模一种长期依赖关系。而ViT这些方法计算量太大,太占内存,于是提出了这个轻量版的Transformer结构(ET)ET只使用了transformer中的encoder,并且作者还使用了feature spilt将QKV划分为小组分别计算注意力最后拼接。文章还在CNN部分提出了一个高频滤波器模块HFM,保留高频信息进行特征提取。
文章主要重点在速度(高效), 效果也是很好的,作者在实验部分提到把ET结构嫁接到RCAN中也能提高RCAN的效果,证明了ET的有效性。

ESRT:Transformer for Single Image Super-Resolution[CVPR 2022]
- Abstract
- 1 Introduction
- 2 Efficient Super-Resolution Transformer
-
- 2.1 Lightweight CNN Backbone (LCB)
- 2.3 Lightweight Transformer Backbone (LTB)
- 3 Experiments
-
- 3.1 Comparisons with Advanced SISR Models
- 3.2 Comparison on Computational Cost
- 3.3 Ablation Study
- 3.4 Real Image Super-Resolution
- 3.5 Comparison with SwinIR
- 4 Conclusion
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/23732.html