设计模式 iic yii jackson background vue代码规范 hadoop源码 bootstrap中文api文档 matlab停止运行命令 nginx默认端口号 matlab颜色代码 edate函数的使用方法 string转16进制 matlab自然对数 python相对路径怎么写 java微服务架构 python类 python环境搭建 java集成 java泛型 php实例教程 kafka中文教程 内存整理软件 计算机网络自顶向下 脚本 lol卡米尔 桌面数字时钟 js代码混淆工具 rpm卸载命令 相册制作工具 鬼灵战马 flushdns 数据库编程软件 x270 python字符串 ps怎么磨皮祛痘 易语言tv 机箱最佳风道图 dll注入器 汉仪黑荔枝体简
当前位置: 首页 > 学习教程  > 编程语言

不用数学公式理解卷积神经网络CNN

2020/8/31 14:34:39 文章标签:

1)导论

卷积神经网络,也就是Convolutional Neural Networks, 那我们平时都称他CNN啦,是深度学习的一个重要算法之一,但是一般一碰到算法就有看数学公式,一查网上的资料也都是各种数学公式来帮助理解,对数学不好的人很不友好!
后来决定跳过数学来看一下cnn他是什么进行计算的cnn现在的用处已经很广泛啦,比如说我之前有用pytorch做过的风格转换,我们很熟悉的物体识别,图像识别,包括验证码识别啥的。
图片来自于 Brandon Rohrer,b站有他的视频不过我没找到中文字幕的,英语好的可以去看看!!是个很好的深度神经网络入门老师!

2)cnn提取特征

好的!那假如我们要从一开始训练一个cnn,用来识别这个是x还是o
在这里插入图片描述
这时候可以告诉一下计算机,这个就是x,白色的框框交叉的就是x,计算机很聪明就就记住了。
但是我们的验证码一般都长得歪歪扭扭的。。。。
在这里插入图片描述
那计算机这个时候就蒙了,又不认识了,这时候就有个一个专业词汇叫“过拟合”。
这个时候咋办,那当然是想想我以前教他的那张x,提取一下他的特征,然后进行对比啦。
我们都知道,图片在电脑里是暗数字存储的,也就是在计算机的眼里,你告诉他的x的图是这样的在这里插入图片描述

如果我们按照普通的1,-1进行匹配那计算机就只认识这一张图,所以我们想到了一个新的匹配办法,叫patch匹配

(又是一个专业名词,在这里“patch”指的就是图片的一个小区域,一个patch是图片的一个3x3或5x5的小正方形区域,我理解就是特征匹配)

所以观察一下这两张x,可以明显的看出他是有三个地方比较相像。在这里插入图片描述
那计算机这个时候通过比对这三个特征,就知道这张是x还是o了。
平时我们所说的人脸识别,说白了也是计算机通过提取你的眼睛鼻子嘴这些特征来判断是不是人。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

我们从这三张图中分别提取了3个特征,在cnn里又被叫卷积核
在这里插入图片描述
一般提取特征都是3x3或5x5的小正方形

3)卷积运算

好!接下来这个卷积运算大部分都需要数学公式来辅助学习,因为高数里面的卷积公式和我们所讲的卷积的思想是一样的!这边可以用图片进行直接的了解卷积是如何运算的。
在这里插入图片描述
其实说白了就是对应相乘,我们取之前教了计算机的x的三张特征图,与需要识别的图片进行相乘,并填入新的图中。
在这里插入图片描述
在这里插入图片描述
直到计算完了9张图
在这里插入图片描述
接下来的工作是对右图九个值求平均,得到一个均值,将均值填入一张新的图中。

这张新的图我们称之为 feature map (特征图)
之所以为什么要放在这里呢,这边就要牵扯到滑动窗口啦!
那滑动窗口下期见!


本文链接: http://www.dtmao.cc/news_show_150239.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?