这篇文章是2022年Vision-Transformer领域的CVPR论文。文章推出了一种新的Vision Transformer模型——Deformable Attention Transformer(DAT)。DAT将DCN运用到Transformer中,从而将注意力的运算集中在重要性区域上,为目标检测带来了一定程度的性能提升。DAT最大的价值在于其使得自注意力层可以聚焦于相关区域来捕获信息。

参考目录:
①源码
②CVPR 2022 | 清华开源DAT:具有可变形注意力的视觉Transformer
③DAT论文解读(暖风)
Vision Transformer with Deformable Attention
- Abstract
- 1 Introduction
- 2 Related Work
- 3 Deformable Attention Transformer
-
- 3.1 Preliminaries
- 3.2 Deformable Attention
- 3.3 Model Architectures
- 4 Experiments
- 5 Conclusion

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/21974.html