利用数据挖掘技术-做好档案编研选题.docx
《利用数据挖掘技术-做好档案编研选题.docx》由会员分享,可在线阅读,更多相关《利用数据挖掘技术-做好档案编研选题.docx(10页珍藏版)》请在咨信网上搜索。
1、利用数据挖掘技术做好档案编研选题随着计算机技术和信息技术的发展,信息产生的渠道越来越多,信息更新的频率日益加快,在“数据过剩”和“信息爆炸”的同时,人们正被信息淹没,却饥渴于有用信息的提取。面对浩渺无际的数据海洋,人们迫切需要一种能够从海量的数据中提取有价值知识和信息的技术,基于人工智能的数据挖掘技术便应运而生,并被广泛应用。一、数据挖掘技术1、数据挖掘所谓数据挖掘(Data Mining,简称DM),是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。数据挖掘是数据库知识发现(KnowledgeDicoveryinDtabases,
2、简称KDD)中的重要技术,它通过对查询内容进行模式的总结和内在规律的搜索,帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为,从而为决策行为提供有利的支持,很多人又将其称为数据淘金。数据挖掘是面向数值数据的挖掘,其功能主要有:(1)自动预测趋势和行为。数据挖掘自动在大型数据中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。(2)关联分析。数据关联是数据库中存在的一类重要的可被发现的知识,若两个或多个变量的取值之间存在某种规律性,就称为关联。关联分析的目的是找出数据库中隐藏的关联网。(3)聚类。数据库中的记录可被划分为一系列
3、有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。(4)概念描述。概念描述就是对某对象的内涵进行描述,并概括这类对象的有关特征,分为特征性描述和区别性描述。(5)偏差检测。数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。2、Web挖掘Web挖掘是一项综合技术,涉及Web、数据挖掘、计算机语言学、信息学等多个领域。Web挖掘就是从Web文档、Web活动中抽取感兴趣的、潜在的有用模式和隐藏信息。它反复使用多种数据挖掘算法,从观测数据中确定模式或合理模型,也是将数据挖
4、掘技术和理论应用于对Web资源进行挖掘的一个新兴的研究领域。Web挖掘的处理流程为查找资源、信息选择和预处理、模式发现、模式分析。Web挖掘可以分为三类0:(1)Web内容挖掘。Web内容挖掘是从文档内容或其描述中抽取知识的过程。Web内容挖掘有两种策略:一种是直接挖掘文件的内容,另一种是在其他工具搜索的基础上进行改进。(2)Web结构挖掘。Web结构挖掘是从Web的组织结构和链接关系中推导知识。由于文档之间的互连Web能够提供除文档内容之外的有用信息,利用这些信息,可以对页面进行排序发现重要页面。(3)Web使用记录的挖掘。Web使用挖掘就是对用户访问Web时在服务器留下的访问记录进行挖掘,
5、其主要目标是从Web的访问记录中抽取感兴趣的模式。Web中每个服务器保留了访问日志,记录关于用户访问和交互的信息。分析这些数据可以帮助理解用户的行为从而改进站点的结构,或为用户提供个性化的服务。二、数据挖掘技术在档案编研选题中的应用选题是依据编纂的材料基础和用户的利用需求来确定编纂题目的工作。在数据挖掘技术出现之前,档案编研部门要了解社会用户对档案文献信息的现实的与潜在的需求,只有通过用户抽样调查或者借阅数据的抽样统计来进行,既费时费力,也分析的不够全面具体。有了数据挖掘技术以后,可以利用档案馆的信息管理系统中的用户借阅数据进行分析统计,可以利用用户经常访问的网页进行分析、挖掘,了解到用户的兴
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 利用 数据 挖掘 技术 做好 档案 选题
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。