Con2d作为torch.nn下的类,主要参数依次为输入通道数量,输出通道数量,卷积核大小,卷积步长,其中输入通道与图片的输入通道一致,输出通道代表经过conv2d后输出的通道数,卷积核大小代表每次与图像中的同样大小的像素区域进行计算。
图片来源的链接https://www.cnblogs.com/RyanXing/p/12852940.html
若padding等于1,拿上图的红色区域的进行计算,则下一次计算input小矩阵为当前矩阵网右移动一格。
结论:conv2d主要作用是指定输出通道和卷积核大小等参数,对图像特征进行提取。
例如:若有输入为(1,3,1,1),conv2d(3,2,1,1)对于每个通道来说都有一个kernel与之对应,三个通道理应会产生三个结果,但是con2d会将三个结果按对应位置相加,产生一个结果,同时kernel_nul数目为2,所以最终会产生通道数为2.



