convlstm2d(convlstm2d怎么导入)

convlstm2d(convlstm2d怎么导入)p 提出了一种时间移位模块 Temporal Shift Module TSM 它能够嵌入到二维卷积神经网络中 使二维卷积神经网络可以高效的进行时间建模 p 具体的 我们可以将一个视频用 A

大家好,我是讯享网,很高兴认识大家。



 <p>提出了一种时间移位模块&#xff08;Temporal Shift Module &#xff0c;TSM&#xff09;它能够嵌入到二维卷积神经网络中&#xff0c;使二维卷积神经网络可以高效的进行时间建模。</p> 

讯享网

具体的,我们可以将一个视频用 A ∈ 𝑅𝑁×𝐶×𝑇×𝐻×𝑊进行表示,这里 N 代表 batch size,C 代表视频的通道数,H 和 W 代表视频帧的分辨率,T 代表时间 维度,通常的 2D 卷积是不依赖时间维度的


讯享网

如图 2.2 左图所示,相同的颜色的方块 代表一个时间点的卷积图。而 TSM 会将 2D 卷积运算得到的卷积图的通道在时间维 度上进行向前或向后的移动,如图 2.2 所示,将一个卷积图的部分通道沿着时间维度 -1 或+1。

理论上对卷积图的通道进行时间维度上的移位不会有计算上的损耗,但是通过实验发现这样是效率不高的并且表现不佳,因为这样操作需要大量的数据移动,这是消耗时间的。

(一)通过对卷积图的部分通道移位代替全部通道的移位来减少数据移动的损耗,TSM 通过对转移通道的不同比例对时间延迟的影响展开了实验,发现随着转移通道的比例增加延迟也随之增加。

(二) 通过实验发现设置不同比例的通道转移可以有不同的延迟损耗,同时也具有对性能的 提升也有不同的影响,该论文对比了不同转移比例对性能的影响,发现转移 14 的通 道数可以取得一个较好的性能,同时保证较小的时间延迟。通过实验对比发现,采用相同 backbone 网络的 TSM 二维卷积网络与 I3D 三维卷积网络,TSM 二维卷积的网络 参数更少,网络延时比 I3D 网络低很多。 另外,它们也提出了采用残差结构,因为残差结构有两条路径,这样就可以使得一条路径用来进行时间移位操作,另一条路径还可以保留原有特征,而本文因为使用的是 ResNet50 残差网络,所以本文也采用了该残差结构,本文的 TSM-ResNet50 网络 的残差块大体可以用图 2.3 表示。

小讯
上一篇 2025-04-22 16:34
下一篇 2025-05-23 09:56

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/202103.html