深度学习入门初探,多层感知器

神经网络模型(多层感知机Multi-LayerPerception)在单层感知器的输入部分和输出层之间加入一层或多层处理单元 , 就构成了二层或多层感知器多层感知器克服了单层感知器的许多缺点 , 原来一些单层感知器无法解决的问题 , 在多层感知器中就可以解决 。
多层感知器 , 为什么能实现非线性?

深度学习入门初探,多层感知器


【深度学习入门初探,多层感知器】因为加入了激活函数 , 激活函数是非线性的就可以实现非线性 , 这个道理很简单 , 可以尝试去用非线性函数套一个线性函数来操作 , 得到的一定是非线性结果 。不过多层感知器网络不一定会有激活函数 , 激活函数也不一定是非线性的 。这个可以人为地设定 , 只是采用非线性激活函数加随机权重初始值的方法是目前理论上和实际验证中得出来的效果最好的方法 。
人工神经网络的本质(物理或数学意义)是什么?
深度学习入门初探,多层感知器


作者曾经写过系列文章《神经网络与深度学习概述 》 , 其中在《第二章 神经网络的概念及感知机模型》 , 从生物和数学方面都有一定介绍 。神经网络全称人工神经网络(Artificial Neural Network, ANN) , 与之相对应的是生物神经网络(Biological Neural Network, BNN) , 将模拟生物神经网络的数学模型统称为人工神经网络模型 。
生物神经系统与生物神经元大量生物神经元的广泛、复杂连接 , 形成生物神经网络实现各种智能活动智能(intelligence)观察、学习、理解和认识的能力理解和各种适应性行为的能力智能是个体有目的的行为、合理的思维、以及有效的适应环境的综合能力 , 也可以说是个体认识客观事物和运用知识解决问题的能力生物神经元(neuron)是基本的信息处理单元生物神经系统生物神经元是基本的信息处理单元 。
生物神经元树突(dendrites):接收来自外接的信息细胞体(cell body): 神经细胞主体 , 信息加工轴突(axon):细胞的输出装置 , 将信号向外传递 , 与多个神经元连接突触 (synapsse):神经元经突触向其它神经元(胞体或树突)传递信号生物神经元的基本特征神经元之间彼此连接神经元之间的连接强度决定信号传递的强弱神经元之间的连接强度可以随训练改变:学习、遗忘、疲劳神经网络中各神经元之间连接的强弱 , 按外部的激励信号做自适应变化兴奋与抑制信号可以起兴奋作用 , 也可以起抑制作用一个神经元接受信号的累积效果(综合大小 , 代数和)决定该神经元的状态(兴奋、抑制)每个神经元可以有一个“阈值”人工神经网络的组成与结构人工神经网络是由大量处理单元经广泛互连而组成的人工网络 , 用来模拟脑神经系统的结构和功能 。
而这些处理单元我们把它称作人工神经元 。人工神经网络可看成是以人工神经元为节点 , 用有向加权弧连接起来的有向图 。在此有向图中 , 人工神经元就是对生物神经元的模拟 , 而有向弧则是轴突—突触—树突对的模拟 。有向弧的权值表示相互连接的两个人工神经元间相互作用的强弱 。神经元及神经网络模型感知机模型感知机模型 , 其基础就是单个神经元模型感知机的学习是有监督的学习 , 学习的问题归结为求权重系数W = (w1, w2, …, wn)和阈值θ 的问题基本思想:逐步将训练集中的样本输入到网络中 , 根据当前输出结果和理想输出结果之间的差别来调整网络中的权重值感知机模型感知器模型无法解决“异或”(XOR)问题 , 即感知器模型无法解决非线性可分问题 。

推荐阅读