Task06:卷积神经网络

  1. convolution层
    1)基本介绍
    convolution层的核心在filter, 它是一个矩阵,比如下图3x3矩阵,它的作用就是提取输入image 3x3大小的特征,3x3像素大小的特征可能整个image里面都有,所以filter需要遍历整个image,步长(stride)可以是1,或者2或其他;

    2)为什么需要很多层convolution层
    假如第一层filter是3x3矩阵,它只能提取3x3像素大小特征,也就是说这个filter顶多只能够识别很微小的特征,比如颜色,但是很大像素的特征比如占据半个image的人脸,3x3的矩阵肯定搞不定了,不过下一层3x3大小的filter 提取的特征肯定不是3x3像素大小的特征,因为它的输入是上一层经过3x3 filter处理过的image, 所以第二层提取的image肯定比3x3像素大,那么经过后面很多convolution层之后,最后面的convolution层filter提取的特征像素肯定就很大了;
  2. 为什么需要max pooling层呢?
    因为filter按照一定的步长(stride)去遍历整个image提取特征,相邻的特征是相近的,也就是重复了,因为他们的像素大部分都共用,只是特征结果值会有大有小,也就是明显不明显,那么取里面特征值最大最明显的特征值就能够代表取得的特征了,这样提取特征既不重复又可以节省参数训练时间
  3. 为什么需要fully connect
    识别一张图片,需要把整个图片所有特征都综合起来,才能最终识别一张图片,但是convolution层filter是提取部分特征,所以fully connect更合适
浙ICP备19012682号