resnet网络架构(resnet网络结构详解)

resnet网络架构(resnet网络结构详解)ResNet 的各种网络结构图如下图所示 Layer gt Block gt Stage gt Network Layer 是最小的单位 ResNet50 代表有 50 层 Block 由两层或者三层 conv 层叠加而成 50 层以下用左侧的双层 block 50 层及以上用右侧的三层 block 其中右侧的这个 block 叫做 BottleNeck 瓶颈结构 nbsp

大家好,我是讯享网,很高兴认识大家。



ResNet的各种网络结构图如下图所示。

resNet50的架构 resnet50网络结构详解_resNet50的架构
讯享网

Layer->Block->Stage->Network

Layer是最小的单位,ResNet50代表有50层。

Block由两层或者三层conv层叠加而成,50层以下用左侧的双层block,50层及以上用右侧的三层block,其中右侧的这个block叫做BottleNeck(瓶颈结构)

resNet50的架构 resnet50网络结构详解_人工智能_02

 数个Block堆叠形成一个Stage,下图中用[ ]框起来的就是一个Stage,一个ResNet中共有4个Stage

resNet50的架构 resnet50网络结构详解_cnn_03

输入Input经过Resnet50到输出Output的5个阶段,共经过了50个层,Stage0中的2层(conv7x7、max pooling),Stage1中9层(3x3),Stage2中的12层(3x4),Stage3中的18层(3x6),Stage4中的9层(3x3)。其中Stage0较为简单,可以看作数据的预处理;后面的Stage1、Stage2、Stage3、Stage4都由Bottleneck组成,结构相似。

Stage0较为简单,可以看作数据的预处理。(3,473,473)为输入的通道数(channel)、高(height)、宽(width),即(c,h,w)。先假设输入的高和宽相等,所以表示为(c,w,w)

该Stage中第1层包括3个先后操作:

1、CONV

        CONV为卷积(Convolution)的缩写,7x7为卷积核的大小,64为卷积核的数量(即该卷积层输出的通道数),stride 2是卷积核的步长为2

2、BN

        BN是Batch Normalization(批标准化)的缩写,即常说是BN层

3、RELU

        RELU为ReLU激活函数

代码中将1个7x7卷积优化为3个3x3的卷积,经过第1个3x3卷积,通道数由3变为64,尺寸应该是(473-3)/2+1=236,即尺寸从473x473变为236x236;经过第2个3x3卷积,通道数为64,尺寸(236-3)/1+1=234,即尺寸从236x236变为234x234;经过第3个3x3卷积,通道数由64变为128,尺寸(234-3)/1+1=232,即尺寸从234x234变为232x232。

该Stage的第2层为maxpool,即最大池化层。kernel为3x3,步长为2。尺寸(232-3+2*1)/2+1=117,即尺寸从232x232变为117x117。池化层不改变通道数。

总体来说,在Stage0中,形状为(3,473,473)的输入经过第1层、第2层得到了形状为(128,117,117)的输出。

理解了Stage1的结构之后就同样能理解Stage2、Stage3、Stage4的结构。

Stage1中有3个瓶颈层。

经过Stage1,通道数变为64x4=256,即形状为(128,117,117)的输入经过该Stage得到了形状为(256,117,117)的输出。

Stage2中有4个瓶颈层。

经过Stage2,通道数变为128x4=512,尺寸变为59x59,即形状为(256,117,117)的输入经过该Stage得到了形状为(512,59,59)的输出。

Stgae3中有6个瓶颈层。

经过Stage3,通道数变为1024,尺寸变为30x30,即形状为(512,59,59)的输入经过该Stage得到了形状为(1024,30,30)的输出。

Stage4中有3个瓶颈层

经过Stage4,通道数变为2048,尺寸变为16x16,即形状为(1024,30,30)的输入经过该Stage得到了形状为(2048,16,16)的输出。

经过一个kernel为7x7的mean-pooling,尺寸变为10x10,即形状为(2048,16,16)的输入经过该池化层得到了形状为(2048,10,10)的输出。

  下图是zyyupup画的ResNet18和ResNet50网络结构图,其中输入的形状为(3,224,224),经过ResNet50模块后输出的形状为(2048,1,1),经过一个FC全连接层将2048个通道与num_class连接。

resNet50的架构 resnet50网络结构详解_神经网络_04

小讯
上一篇 2025-06-13 13:24
下一篇 2025-06-04 07:40

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/171285.html