cnn卷积神经网络原理

cnn卷积神经网络原理

ID:21439997

大小:263.97 KB

页数:30页

时间:2018-10-22

cnn卷积神经网络原理_第1页
cnn卷积神经网络原理_第2页
cnn卷积神经网络原理_第3页
cnn卷积神经网络原理_第4页
cnn卷积神经网络原理_第5页
资源描述:

《cnn卷积神经网络原理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、

2、一、CNN卷积神经网络原理简介http://blog.csdn.net/u012162613/article/details/43225445本文主要是详细地解读CNN的实现代码。如果你没学习过CNN,在此推荐周晓艺师兄的博文:DeepLearning(深度学习)学习笔记整理系列之(七),以及UFLDL上的卷积特征提取、池化CNN的最大特点就是稀疏连接(局部感受)和权值共享,如下面两图所示,左为稀疏连接,右为权值共享。稀疏连接和权值共享可以减少所要训练的参数,减少计算复杂度。    至于CNN的结构

3、,以经典的LeNet5来说明:这个图真是无处不在,一谈CNN,必说LeNet5,这图来自于这篇论文:Gradient-BasedLearningAppliedtoDocument

4、Recognition,论文很长,第7页那里开始讲LeNet5这个结构,建议看看那部分。我这里简单说一下,LeNet5这张图从左到右,先是input,这是输入层,即输入的图片。input-layer到C1这部分就是一个卷积层(convolution运算),C1到S2是一个子采样层(pooling运算),关于卷积和子采样的具体

5、过程可以参考下图:然后,S2到C3又是卷积,C3到S4又是子采样,可以发现,卷积和子采样都是成对出现的,卷积后面一般跟着子采样。S4到C5之间是全连接的,这就相当于一个MLP的隐含层了(如果你不清楚MLP,参考《DeepLearningtutorial(3)MLP多层感知机原理简介+代码详解》)。C5到F6同样是全连接,也是相当于一个MLP的隐含层。最后从F6到输出output,其实就是一个分类器,这一层就叫分类层。ok,CNN的基本结构大概就是这样,由输入、卷积层、子采样层、全连接层、分类层、输出这

6、些基本“构件”组成,一般根据具体的应用或者问题,去确定要多少卷积层和子采样层、采用什么分类器。当确定好了结构以后,如何求解层与层之间的连接参

7、数?一般采用向前传播(FP)+向后传播(BP)的方法来训练。具体可参考上面给出的链接。二、CNN卷积神经网络代码详细解读(基于python+theano)代码来自于深度学习教程:ConvolutionalNeuralNetworks(LeNet),这个代码实现的是一个简化了的LeNet5,具体如下:·没有实现location-specificgainandbia

8、sparameters·用的是maxpooling,而不是average_pooling·分类器用的是softmax,LeNet5用的是rbf·LeNet5第二层并不是全连接的,本程序实现的是全连接另外,代码里将卷积层和子采用层合在一起,定义为“LeNetConvPoolLayer“(卷积采样层),这好理解,因为它们总是成对出现。但是有个地方需要注意,代码中将卷积后的输出直接作为子采样层的输入,而没有加偏置b再通过sigmoid

9、函数进行映射,即没有了下图中fx后面的bx以及sigmoid映射,也即直

10、接由fx得到Cx。最后,代码中第一个卷积层用的卷积核有20个,第二个卷积层用50个,而不是上面那张LeNet5图中所示的6个和16个。了解了这些,下面看代码:(1)导入必要的模块[python] viewplain copy1.import cPickle  2.import gzip  3.import os  4.import sys  5.import time  6.  7.import numpy  8.  9.import theano  10.import theano.tensor a

11、s T  11.from theano.tensor.signal import downsample  12.from theano.tensor.nnet import conv  (2)定义CNN的基本"构件"CNN的基本构件包括卷积采样层、隐含层、分类器,如下·定义LeNetConvPoolLayer(卷积+采样层)见代码注释:[python] viewplain copy1.""" 2.卷积+下采样合成一个层LeNetConvPoolLayer 3.rng:随机数生成器,用于初始化W 4.i

12、nput:4维的向量,theano.tensor.dtensor4 

13、1.filter_shape:(number of filters, num input feature maps,filter height, filter width) 2.image_shape:(batch size, num input feature maps,image height, image width) 3.poolsize: (#rows, #cols) 4."

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。