《PyTorch深度学习快速入门教程》学习笔记(第20周)
目录
摘要
Abstract
1. 池化层原理
2. 二维池化层
3. 二维最大池化
4. 填充、步幅与多个通道
5. 平均池化层
6. 理论总结
7. 池化层处理数据
8. 池化层处理图片
摘要
本周报的目的在于汇报《PyTorch深度学习快速入门教程》课程第六周的学习成果,主要聚焦于Transforms的使用以及其相关内容。
在这本周的学习中,课程内容主要涵盖了池化层原理,包括步幅,填充原理,以及池化层实践等等。
本篇文章将对学习内容进行详细的阐述,并在最后部分对本周的学习内容进行总结。本周报旨在通过这种方式,将理论知识与实践应用有效地结合起来,为深度学习的基础内容学习与方向提供概括性总结。
Abstract
The purpose of this weekly report is to present the learning outcomes of the sixth week of the PyTorch Deep Learning Quick Start Tutorial course, with a focus on the use of Transformers and its related content.
In this week's learning, the course content mainly covers the principle of pooling layer, including stride, filling principle, and pooling layer practice, etc.
This article will provide a detailed explanation of the learning content and summarize the learning content for this week in the final section. This weekly report aims to effectively combine theoretical knowledge with practical applications in this way, providing a summary of the basic content and direction of deep learning learning learning.
1. 池化层原理
① 最大池化层有时也被称为下采样。
② dilation为空洞卷积,如下图所示。
③ Ceil_model为当超出区域时,只取最左上角的值。
④ 池化使得数据由5 * 5 变为3 * 3,甚至1 * 1的,这样导致计算的参数会大大减小。例如1080P的电影经过池化的转为720P的电影、或360P的电影后,同样的网速下,视频更为流畅。
2. 二维池化层
① 二维卷积层可以帮助我们检测图像物体边缘。
② 无论是原始图片,还是经过卷积核处理的中间特征,都是基于像素的基础进行的数学运算。
③ 实际图像里,我们感兴趣的物体不会总出现在固定像素位置:即使我们用三脚架固定相机去连续拍摄同一个物体也极有可能出现像素位置上的偏移。
④ 这会导致同一个物体的边缘对应的输出可能出现在卷积输出中的不同位置,进而对后面的模式识别造成不便。
⑤ 另外,绝大多数计算机视觉任务对图像处理终极目标是识别图片内的物体,所以不需要细致到对每个像素进行检测,只需要找到图片中物体的大概轮廓就好了。
⑥ 池化层可以缓解卷积层对位置的过度敏感性。
① 如下所示,例如1X2的卷积核[1,-1],会使得下图中Y输出的第二列为1,其他为0,如果像素偏移,会导致边缘检测的1在其他位置输出,所以说卷积对像素的位置是非常敏感的。
② 这里本质上讲的是池化层对于像素偏移的容忍性。
3. 二维最大池化
① 卷积输出上作用一次2X2池化,如下图所示。
4. 填充、步幅与多个通道
5. 平均池化层
① 平均池化层相对最大池化层有柔和的效果。
6. 理论总结
① 池化层返回窗口中最大或平均值。
② 缓解卷积层位置的敏感性。
③ 同样有窗口大小、填充和步幅作为超参数。
7. 池化层处理数据
8. 池化层处理图片
① 在 Anaconda 终端里面,激活py3.6.3环境,再输入 tensorboard --logdir=C:\Users\wangy\Desktop\03CV\logs 命令,将网址赋值浏览器的网址栏,回车,即可查看tensorboard显示日志情况。