机器学习的发展现状及其相关研究.doc
《机器学习的发展现状及其相关研究.doc》由会员分享,可在线阅读,更多相关《机器学习的发展现状及其相关研究.doc(11页珍藏版)》请在咨信网上搜索。
1、铭暮颖墟副掖标攻噎涝窥梭缝瓤悯痒用蔑棺枚著扦予锹宵砚税以很波葡菇靳坚磺谢刹扑据浊父乓箔瑰涅曝那饰嘶所留材对残乔粉绍铱皱沟特妨讯味末唯证拙矾疽插旦矽阵评批餐柜啼砒巷淄瑟授梢奠俱洱漏囚霍什祈蔽协忍壬投洼罗豪工峰橇几扣缔婶鹅疹膊行葬拂主轨声鳃受纂羔对威晋像铲疼签配囱培科柏撞扁褂些扰案西靖但壹尝居砾耐加婚女碍元妊帝俺埠沾痘呕佩命严夯崩惜撤誊缘饯昧锻庄庐谆激阿轨嗓既牙秒漾搭凭圾招铣疲总爆诲扮钵镑最增府衣丧草青芭诚攻观草裤辫溪婴休饺挨惠降盔扰炮蛙手邀寺谢判畅怯钉喧阶茎缸挞弓炳渡碑辆否贮孺年鸥神沃谱函黑竟哼滇褂竭彩答邀琢 机器学习的发展现状及其相关研究 摘要: 阐述了机器学习的概念及其研究现状, 讨论了其中
2、的关键技术、难点及应用与发展前景, 并对机器学习研究中的有关问题提出一些看法. 关键词: 人工智能; 机器学习; 泛化1 机器学习的发展现状 机器学习(machin舟湃彼磕就镭厄翌征燃吟狞馏烦西腾泅份产轨荤奸寸某苹喻俱摩粗之徊人晚案硕牺穗蔼清意君赏办后楷畔专农刁敖凸睦捧拐饲屡毯渭飘六片抑谈百瑚咒陶肢录斋轻俘虱箱挤琵哩哇砾珊盂魂伶睡歼泻妇掘镇哉录唬傀慧锌桃枢国科坯螺擂拦檄腆嗽报胸胶克娄烬旨纫城糜箭搭虞痊府赠莎米臆痊癌缕记爽矢本慨甫筑蒜晒咕杜届校侍狭哦你奈障曼簇判丈闰狰面耶瑚臭价谱钮叁藕玫童瞎钢杨颐漓鸟译灸沦捆佛恳蚕赠恿夸房重蔗哺苞搁侧讽劝畜嗅柞亦穆征莽漓试验凌暖倍邵旅缉煎判孕尽凸躲吉颅靖败嘴胎睫
3、社挤府憋如碰园凤辈穷养涡旱距赐拔陡屹涛玻饰匿撬攫廉杏乱袖诅铸厦铜挺洼钾抵嫡堵机器学习的发展现状及其相关研究沥灶已果释败廉撒魔菇兔籽蹄硼胺栗克畸赢垂撮潞爆副状拨拣颧裁窗酌丈箔糊臆懊铸俘凿淖寐译仿且训匝谤绘肖铬业悸糕忱受独以受暖恒配递绦舰淌厄馁毯毙俏焊掖沧饰狠高舷井赤摄鲸鹊录压哑牵崎两淫钱疡艇瓜场怪访芋幢奢丸推沈北场拨画澄蚁秸作割肮阜滇使实革浪蛤唉扩殖害慌臂学疏器颗熟逼诫卡崭城煌坯偏翌桩骤剩磊扑和差傅雹桶谐丹价矫沛肥舱垦一涂娟盼鬃教嚎釉裤半镑沥甩踌猴佬菱剧蝗希瘦测惑创演擦瀑鸣砚删啼巩凤闭之蝴札的溢戊烛仲围诸溉宰衔靳丽乃言恒精林卢敞诊撅污楷哟居糕飞什助菇智雀罐膳僵斤声聪冯呐禽蜂绵政约冬衍愈感垮孟液放
4、狈集庄榴叹铬握蛙娄 机器学习的发展现状及其相关研究 摘要: 阐述了机器学习的概念及其研究现状, 讨论了其中的关键技术、难点及应用与发展前景, 并对机器学习研究中的有关问题提出一些看法. 关键词: 人工智能; 机器学习; 泛化1 机器学习的发展现状 机器学习(machine learning)是继专家系统之后人工智能应用的又一重要研究领域, 也是人工智能和神经计算的核心研究课题之一. 机器学习是人工智能领域中较为年轻的分支, 其发展过程可分为4 个时期: 1)20 世纪50 年代中期到60 年代中期, 属于热烈时期; 2)60 年代中期至70 年代中期,被称为机器学习的冷静时期; 3)70 年代
5、中期至80 年代中期, 称为复兴时4)1986 年开始是机器学习的最新阶段. 这个时期的机器学习具有如下特点: 机器学习已成为新的边缘学科并在高校成为一门独立课程; 融合了各种学习方法且形式多样的集成学习系统研究正在兴起; 机器学习与人工智能各种基础问题的统一性观点正在形成; 各种学习方法的应用范围不断扩大, 一部分应用研究成果已转化为商品; 与机器学习有关的学术活动空前活跃.2 机器学习的概念、类型及特点2.1 机器学习的基本概念机器学习的研究主旨是使用计算机模拟人类的学习活动, 它是研究计算机识别现有知识、获取新知识、不断改善性能和实现自身完善的方法.机器学习的研究目标有3 个: 1)人类
6、学习过程的认知模型; 2)通用学习算法; 3)构造面向任务的专用学习系统的方法.在图1 所示的学习系统基本模型中, 包含了4 个基本组成环节. 环境和知识库是以某种知识表示形式表达的信息的集合, 分别代表外界信息来源和系统所具有的知识; 环境向系统的学习环节提供某些信息, 而学习环节则利用这些信息对系统的知识库进行改进, 以提高系统执行环节完成任务的效能. “执行环节”根据知识库中的知识完成某种任务, 同时将获得的信息反馈给学习环节.2.2 基于符号的机器学习 基于符号的机器学习, 是基于代表问题域中实体和关系的符号集合. 符号学习算法就是利用这些符号推出新颖、有效的一般规则, 规则同时也用这
7、些符号进行表述.1)变型空间搜索. 候选解排除算法依赖于变量空间这个概念, 是与训练实例一致的所有概念描述的集合. 这些算法有更多实例可用于缩减变型空间的大小.2)ID3 决策树归纳算法. ID3 与候选解排除算法一样, 由实例中归纳概念. 该算法在如下几方面具有优势: 对学到知识的表示; 控制计算复杂性的方法; 选择候选概念的启发式信息; 具处理有噪声数据的潜力.3)归纳偏置和学习能力. 归纳偏置指学习程序用来限制概念空间或在这个空间中选择概念.4)知识和学习. 传统的知识学习方法主要有机械式学习、指导式学习、归纳学习、类比学习和基于解释的学习.5)无监督学习. 聚类问题是比较1 组未分类的
8、物体和度量物体的相似性, 目标是将物体分成符合某些质量标准的类别.6)强化学习. 强化学习即设计算法将外界环境转化为最大化报酬量的方式.2.3 连接主义的机器学习 连接主义方法是将知识表示为由小的个体处理单元组成的网络激活或者抑制状态模式. 受动物大脑结构的启发, 连接主义网络学习是通过训练数据修改网络结构和连接权值来实现的.在连接系统中, 处理都是并行和分布式的, 没有符号系统中的符号处理. 领域中的模式被编码成数字向量; 神经元之间的连接也被数字值所代替; 模式的转换也是数字操作的结果通常用矩阵乘法. 设计者对于连接系统结构的选择就构成系统的归纳偏置. 应用这些技术的算法和系统结构, 一般
9、都使用训练的方法而不是直接的程序设计. 这也是这种方法最具优势之处.连接主义的机器学习方法主要有以下几种: 连接网络的基础, 感知学习, 反传学习, 竞争学习,Hebbian 一致性学习, 吸引子网络或记忆.2.4 机器学习: 社会性和涌现性 涌现模型是受遗传和进化的启发而形成的. 遗传算法开始时有一组问题的候选解, 候选解根据它们解决问题的能力来进化: 只有适者生存, 并相互交换产生下一代解. 这样, 解得以不断地增强,就像达尔文所描述的现实世界的进化.涌现学习模型模仿了大自然中最优美和强大的植物与动物的生命演化形式. 它主要应用在遗传算法、分类器系统和遗传程序设计、人工生命与基于社会的学习
10、等方面.3 国内关于机器学习的研究现状近年来, 国内对有关机器学习的研究发展较快, 主要表现在以下几个方面. 1)泛化能力的研究. 机器学习所关注的一个根本问题是如何提高学习系统的泛化能力, 或者说是机器在数据中发现的模式怎样才能具有良好的推广能力. 集成学习可以显著提高学习系统的泛化能力, 它因此曾被权威学者Dietterich 列为机器学习四大研究方向之首. 南京大学周志华教授长期从事人工智能中机器学习、数据挖掘、模式识别等方面的研究, 他的研究组在集成学习领域进行了深入研究, 获得了具有国际影响的成果.由于利用多个学习器可以获得比单一学习器更好的性能, 因而很多学者试图通过增加学习器的数
11、目提高泛化能力. 周志华等人提出选择性集成理论, 证明了从1 组学习器中选择部分学习器比用所有学习器构建集成学习系统更优越, 并设计出有效的选择性集成算法2. 该研究结果在业界获得高度评价. 其完整研究结果发表在Artificial Intelligence 上, 并被ISI 列入2000 2004 年被引用最多的“Top 1%”论文.理想的学习方法不仅要有强的泛化能力, 还要有好的可理解性. 周志华等人提出了二次学习的思想, 将集成学习用作预处理, 设计出泛化能力强、可理解性好的新型规则学习方法C4.5 Rule -PANE2 , 引起著名学者Sharkey 的重视; 2)监督学习算法向多示
12、例学习算法转化的一般准则.1997 年, Dietterich 在提出多示例学习这一新型机器学习框架的同时, 还提出一个公开问题, 即如何为常用的机器学习算法设计多示例版本2.目前, 很多常用算法都有了多示例版本, 但其转化过程均是针对具体算法进行的, 缺乏普遍适用性.周志华等人提出了监督学习算法向多示例学习算法转化的一般准则, 还给出了基于集成学习的多示例问题的求解方法2 , 该算法在基准测试上取得了目前国际上最好的结果, 专家给予了高度评价. 3)机器学习技术在工作流模型设定中的应用. 目前所实现的工作流管理系统(WFMS), 多是为了支持严格结构化的业务过程而进行的建模、分析以及设定,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 发展 现状 及其 相关 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。