神经网络最早是模拟人的大脑神经元的功能,企图用通过模拟大脑来获得人脑的智慧。但事实证明,这种初衷无法得到实现,倒是意外的获得了一些对非线性函数的拟合办法。而在已有的工程应用中,有一个网络应用较为成功,那就是卷积网络。
什么是卷积?
卷积是现代数学基础泛函分析中的一个运算,它是通过两个函数f和g生成第三个函数的一种数学算子,它用来表示函数f和g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分。
通过它的定义就知道,如果重叠的长度是c,假设函数f取值f(c),那么另外函数g,就平移c,变成g(x-c),那么这两个函数值的乘积对c的积分,就是卷积。由于卷积运算有很好的数学性质,所以它能把一些复杂的计算进行简化。
比如关于卷积的卷积定理就指出,函数卷积的傅立叶变换是函数傅立叶变换的乘积。也就是一个域中的卷积相当于另一个域中的乘积。
在统计学中,加权的滑动平均就是一种卷积。
在神经网络中,用到这种卷积运算的网络,我们就叫它卷积网络。
卷积网络是一种特殊的神经网络,为何特殊?因为它有一个重要的先验,这个先验就是平移等变性。比如一个苹果的图像,从A点移到到B点,A和B的背景有很大区别,但这个图像仍然那个图像。因为这个特性,所以卷积网络对图像识别的贡献是巨大的。
所以卷积网络中有三个核心的部分:卷积、探测和池化。卷积类似滑动平均,而池化是实现平移动不变性,比如取最大值,当样本变化时,网络总是会选取与训练目标匹配最大的那个。比如手写的数字,当它旋转时,仍然可以在网络中识别出来(6和9是一个例外)。
卷积网络最核心的应用价值就在于它跟事物中某一些领域的规律是完全吻合的,那就是一个事物在有限的时间内,它的外貌会保持不变。如果知道这个事物的外部主要特征越多,那么当他做旋转变化时,仍然可以从背景中挑选出来。所以等变性是卷积网络的价值。没有这个价值,它的其他特征跟其他神经网络没有太大的区别。
因为它建模了等变性,等于把人类的经验知识内置于其中,所以它在计算上也有很好的性质,比如稀疏交互和参数共享。有了这两个性质,再凭借现代计算机的能力,卷积网络的训练成为可能,尤其是深度的卷积网络。这是现在人工智能再次兴起,并在对象识别领域大放异彩的头位功臣。
卷积网络,实践了深度学习的核心思想——先学习简单的概念,在学习由简单概念组成的复杂概念,从简单到复杂。某种意义上,它模拟了人类学习的方式。虽然模式上没有超越人类学习的认知局限,但机器的学习比人类会更快,只要电力充足。
热门跟贴