深置信网络BDN.pptx
《深置信网络BDN.pptx》由会员分享,可在线阅读,更多相关《深置信网络BDN.pptx(62页珍藏版)》请在咨信网上搜索。
1、PPT模板下载: Regression)带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR)的浅层模型局限性:有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受限。基本概念基本概念浅层学习与深度学习浅层学习与深度学习上海海洋大学信息学院上海海洋大学信息学院2006年,加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton在科学上发表论文提出深度学习主要观点:1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;2)深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-w
2、isepre-training)来有效克服,逐层初始化可通过无监督学习实现的。基本概念基本概念上海海洋大学信息学院上海海洋大学信息学院深度学习:深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示深度神经网络:含有多个隐层的神经网络基本概念基本概念上海海洋大学信息学院上海海洋大学信息学院深度学习:一种基于无监督特征学习和特征层次结构的学习方法可能的的名称:深度学习特征学习无监督特征学习基本概念基本概念上海海洋大学信息学院上海海洋大学信息学院深度学习的优势:能以更加紧凑简洁的方式来表达比浅层网络大得多的函数集合训练深度学习的困难:(1)数据获取问题考虑到深度网
3、络具有强大的表达能力,在不充足的数据上进行训练将会导致过拟合(2)局部极值问题与梯度下降法有关基本概念基本概念上海海洋大学信息学院上海海洋大学信息学院深度学习深度学习本质:通过构建多隐层的模型和海量训练数据(可为无标签数据),来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型”是手段,“特征学习”是目的。与浅层学习区别:1)强调了模型结构的深度,通常有5-10多层的隐层节点;2)明确突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。上海海
4、洋大学信息学院上海海洋大学信息学院深度学习深度学习好处:可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示。上海海洋大学信息学院上海海洋大学信息学院深度学习深度学习 vs.vs.神经网络神经网络相同点:相同点:二者均采用分层结构,系统包括输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个logistic 回归模型。不同点:不同点:神经网络:采用BP算法调整参数,即采用迭代算法来训练整个网络。随机设定初值,计算当前网络的输出,然后根据当前输出和样本真实标签之间的差去改变前面各层的参数,直到收敛;深度
5、学习:采用逐层训练机制。采用该机制的原因在于如果采用BP机制,对于一个deep network(7层以上),残差传播到最前面的层将变得很小,出现所谓的gradient diffusion(梯度扩散)。上海海洋大学信息学院上海海洋大学信息学院神经网络的局限性:1)比较容易过拟合,参数比较难调整,而且需要不少技巧;2)训练速度比较慢,在层次比较少(小于等于3)的情况下效果并不比其它方法更优;上海海洋大学信息学院上海海洋大学信息学院深度学习训练过程深度学习训练过程不采用BP算法的原因(1)反馈调整时,梯度越来越稀疏,从顶层越往下,误差校正信号越来越小;(2)收敛易至局部最小,由于是采用随机值初始化,
6、当初值是远离最优区域时易导致这一情况;(3)BP算法需要有标签数据来训练,但大部分数据是无标签的;上海海洋大学信息学院上海海洋大学信息学院深度学习训练过程深度学习训练过程第一步:采用自下而上的无监督学习1)逐层构建单层神经元。2)每层采用wake-sleep算法进行调优。每次仅调整一层,逐层调整。这个过程可以看作是一个feature learning的过程,是和传统神经网络区别最大的部分。上海海洋大学信息学院上海海洋大学信息学院深度学习训练过程深度学习训练过程wake-sleep算法:1 1)wakewake阶段:阶段:认知过程,通过下层的输入特征(认知过程,通过下层的输入特征(InputIn
7、put)和向上的认知()和向上的认知(EncoderEncoder)权重)权重产生每一层的抽象表示(产生每一层的抽象表示(CodeCode),再通过当前的生成(),再通过当前的生成(DecoderDecoder)权重产)权重产生一个重建信息(生一个重建信息(ReconstructionReconstruction),计算输入特征和重建信息残差,使),计算输入特征和重建信息残差,使用梯度下降修改层间的下行生成(用梯度下降修改层间的下行生成(DecoderDecoder)权重。也就是)权重。也就是“如果现实跟如果现实跟我想象的不一样,改变我的生成权重使得我想象的东西变得与现实一样我想象的不一样,改
8、变我的生成权重使得我想象的东西变得与现实一样”。2 2)sleepsleep阶段:阶段:生成过程,通过上层概念(生成过程,通过上层概念(CodeCode)和向下的生成()和向下的生成(DecoderDecoder)权重,生成下)权重,生成下层的状态,再利用认知(层的状态,再利用认知(EncoderEncoder)权重产生一个抽象景象。利用初始上)权重产生一个抽象景象。利用初始上层概念和新建抽象景象的残差,利用梯度下降修改层间向上的认知层概念和新建抽象景象的残差,利用梯度下降修改层间向上的认知(EncoderEncoder)权重。也就是)权重。也就是“如果梦中的景象不是我脑中的相应概念,改如果梦
9、中的景象不是我脑中的相应概念,改变我的认知权重使得这种景象在我看来就是这个概念变我的认知权重使得这种景象在我看来就是这个概念”。上海海洋大学信息学院上海海洋大学信息学院深度学习训练过程深度学习训练过程EncoderDecoderInputImageClasslabele.g.FeaturesEncoderDecoderFeaturesEncoderDecoderAutoEncoder:上海海洋大学信息学院上海海洋大学信息学院深度学习训练过程深度学习训练过程第二步:自顶向下的监督学习第二步:自顶向下的监督学习 这一步是在第一步学习获得各层参数进的基础这一步是在第一步学习获得各层参数进的基础上,在
10、最顶的编码层添加一个分类器(例如罗杰上,在最顶的编码层添加一个分类器(例如罗杰斯特回归、斯特回归、SVMSVM等),而后通过带标签数据的监等),而后通过带标签数据的监督学习,利用梯度下降法去微调整个网络参数。督学习,利用梯度下降法去微调整个网络参数。深度学习的第一步实质上是一个网络参数初始深度学习的第一步实质上是一个网络参数初始化过程。区别于传统神经网络初值随机初始化,化过程。区别于传统神经网络初值随机初始化,深度学习模型是通过无监督学习输入数据的结构深度学习模型是通过无监督学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。
11、够取得更好的效果。上海海洋大学信息学院上海海洋大学信息学院深度神经网络的演化神经网络深度神经网络多层感知器上海海洋大学信息学院上海海洋大学信息学院在有了多层感知器之后为什么还在有了多层感知器之后为什么还需要提出深度学习?需要提出深度学习?上海海洋大学信息学院上海海洋大学信息学院1)强调了模型结构的深度,通常有5-10多层的隐层节点;2)明确突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。3)可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输
12、入数据分布式表示。深度神经网络深度神经网络上海海洋大学信息学院上海海洋大学信息学院深度神经网络深度神经网络神经网络:深度学习:上海海洋大学信息学院上海海洋大学信息学院1)自动编码器(AutoEncoder)2)稀疏自编码(Sparse AutoEncoder)3)卷积神经网络4)限制玻尔兹曼机降噪自动编码器(Denoising AutoEncoders);深度玻尔兹曼机(Deep Boltzmann Machine);卷积波尔兹曼机;深度学习的具体模型与方法深度学习的具体模型与方法上海海洋大学信息学院上海海洋大学信息学院RBM(受限玻尔兹曼机)上海海洋大学信息学院上海海洋大学信息学院受限玻尔兹
13、曼机(Restricted Boltzmann Machine,简称RBM)是由Hinton和Sejnowski于1986年提出的一种生成式随机神经网络(generative stochastic neural network),该网络由一些可见单元(visible unit,对应可见变量,亦即数据样本)和一些隐藏单元(hidden unit,对应隐藏变量)构成,可见变量和隐藏变量都是二元变量,亦即其状态取0,1。整个网络是一个二部图,只有可见单元和隐藏单元之间才会存在边,可见单元之间以及隐藏单元之间都不会有边连接基本概念基本概念受限玻尔兹曼机上图所示的上图所示的RBM含有含有9个可见单元个可
14、见单元(构构成一个向量成一个向量v)和和3个隐藏单元个隐藏单元(构成一个构成一个向量向量h),W是一个是一个9*3的矩阵,表示可的矩阵,表示可见单元和隐藏单元之间的边的权重。见单元和隐藏单元之间的边的权重。上海海洋大学信息学院上海海洋大学信息学院RBM是玻尔兹曼机(Boltzmannmachine,BM)的一种特殊拓扑结构。BM的原理起源于统计物理学,是一种基于能量函数基于能量函数的建模方法,能够描述变量之间的高阶相互作用,BM的学习算法较复杂,但所建模型和学习算法有比较完备的物理解释和严格的数理统计理论作基础。BM是一种对称耦合的随机反馈型二值单元神经网络对称耦合的随机反馈型二值单元神经网络
15、,由可见层和多个隐层组成,网络节点分为可见单元(visibleunit)和隐单元(hiddenunit),用可见单元和隐单元来表达随机网络与随机环境的学习模型,通过权值表达单元之间的相关性。BM是由Hinton和Sejnowski提出的一种随机递归神经网络,可以看做是一种随机生成的Hopfield网络,是能够通过学习数据的固有内在表示解决困难学习问题的最早的人工神经网络之一,因样本分布遵循玻尔兹曼分布而命名为BM。BM由二值神经元构成,每个神经元只取1或0这两种状态,状态1代表该神经元处于接通状态,状态0代表该神经元处于断开状态。基本概念基本概念上海海洋大学信息学院上海海洋大学信息学院正如名字
16、所提示的那样,受限玻尔兹曼机是一种玻尔兹曼机的变体,但限定模型必须为二分图。模型中包含对应输入参数的输入(可见)单元和对应训练结果的隐单元,图中的每条边必须连接一个可见单元和一个隐单元。(与此相对,“无限制”玻尔兹曼机包含隐单元间的边,使之成为递归神经网络。)这一限定使得相比一般玻尔兹曼机更高效的训练算法成为可能,特别是基于梯度的对比分歧(contrastivedivergence)算法。基本概念基本概念受限玻尔兹曼机上海海洋大学信息学院上海海洋大学信息学院“预训练预训练”方法方法限制玻尔兹曼机(限制玻尔兹曼机(RBM)RBMRBM网网络络共共有有2 2层层,其其中中第第一一层层称称为为可可视
17、视层层,一一般般来来说说是是输输入入层层,另另一一层层是是隐隐含含层层,也也就就是是我我们们一一般般指指的的特特征征提提取取层层。是是可可视视层层与与隐隐藏藏层层之之间间的的权重矩阵,权重矩阵,是可视节点的偏移量,是可视节点的偏移量,是隐藏节点的偏移量。是隐藏节点的偏移量。隐含层隐含层可视层可视层上海海洋大学信息学院上海海洋大学信息学院“预训练预训练”方法方法限制玻尔兹曼机(限制玻尔兹曼机(RBM)上海海洋大学信息学院上海海洋大学信息学院RBM的学习目标的学习目标-最大化似然最大化似然(Maximizinglikelihood)RBM是一种基于能量(Energy-based)的模型,其可见变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 置信 网络 BDN
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。