数据挖掘习题题.doc
《数据挖掘习题题.doc》由会员分享,可在线阅读,更多相关《数据挖掘习题题.doc(11页珍藏版)》请在咨信网上搜索。
1、数据挖掘复习题单选题1、 某超市研究销售纪录数据后发现,买啤酒得人很大概率也会购买尿布,这种属于数据挖掘得哪类问题?(A) 、 关联规则发现 B、 聚类 C、 分类 D、 自然语言处理2、以下两种描述分别对应哪两种对分类算法得评价标准? (A) (a)警察抓小偷,描述警察抓得人中有多少个就是小偷得标准。 ()描述有多少比例得小偷给警察抓了得标准. A、 Prciion,Recal B、Recall, Peciion A、 rso, ROC D、 Rcall, ROC3、将原始数据进行集成、变换、维度规约、数值规约就是在以下哪个步骤得任务?(C) A、 频繁模式挖掘 、 分类与预测 C、 数据预
2、处理 D、 数据流挖掘4、 当不知道数据所带标签时,可以使用哪种技术促使带同类标签得数据与带其她标签得数据相分离?() A、分类 B、聚类 、 关联分析 、 隐马尔可夫链5、 什么就是KDD? (A) A、 数据挖掘与知识发现 B、 领域知识发现 、 文档知识发现 D、动态知识发现、 使用交互式得与可视化得技术,对数据进行探索属于数据挖掘得哪一类任务?(A) A、 探索性数据分析 B、建模描述 、预测建模 、 寻找模式与规则7、 为数据得总体分布建模;把多维空间划分成组等问题属于数据挖掘得哪一类任务?(B) A、 探索性数据分析 、建模描述 C、 预测建模 D、 寻找模式与规则8、 建立一个模
3、型,通过这个模型根据已知得变量值来预测其她某个变量值属于数据挖掘得哪一类任务?(C) A、根据内容检索 B、建模描述 C、预测建模 D、寻找模式与规则9、用户有一种感兴趣得模式并且希望在数据集中找到相似得模式,属于数据挖掘哪一类任务?() 、 根据内容检索 B、 建模描述 C、预测建模 D、 寻找模式与规则 1、下面哪种不属于数据预处理得方法? (D)A变量代换 B离散化 C 聚集 D 估计遗漏值 2、 假设12个销售价格记录组已经排序如下:5, , 11, 3, 15, 35, 5, , 7, 92, 204,215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,5在第几个箱子内?
4、 (B)A 第一个 B 第二个 C 第三个 D 第四个 3、上题中,等宽划分时(宽度为50),15又在哪个箱子里? (A)A 第一个 B 第二个 C 第三个 D第四个 14、下面哪个不属于数据得属性类型:(D) 标称 序数 C 区间 D相异 15、在上题中,属于定量得属性类型就是:()A标称 B 序数 区间 相异 16、 只有非零值才重要得二元属性被称作:( C )A 计数属性 B 离散属性 C非对称得二元属性 D 对称属性 、以下哪种方法不属于特征选择得标准方法: (D)A嵌入 B 过滤 C 包装 D 抽样 18、下面不属于创建新属性得相关方法得就是: ()A特征提取 B特征修改 映射数据到
5、新得空间 D特征构造 19、 考虑值集1、3、4、5、,其截断均值(=20)就是 (C)A B 3 3、 D5 20、 下面哪个属于映射数据到新得空间得方法? ()A 傅立叶变换 特征加权 C渐进抽样 D维归约 、 熵就是为消除不确定性所需要获得得信息量,投掷均匀正六面体骰子得熵就是: (B)A 1比特 2、6比特 C 3、比特 D 3、8比特 2、假设属性ine得最大最小值分别就是12000元与900元。利用最大最小规范化得方法将属性得值映射到0至1得范围内.对属性ine得0元将被转化为:(D)0、8 B1.224 C 、458 D0、76 23、假定用于分析得数据包含属性e。数据元组中ag
6、e得值如下(按递增序):13,15,16,16,19,0,20,1,2,22,2,25,25,30,,3,35,35,6,0,5,4,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱得深度为3。第二个箱子值为:(A)A 8、 B2.6 C 6、8 27、9 2、 考虑值集12 24 3 2455 68 26,其四分位数极差就是:()A 31 B 24 C 5 D 3 25、 一所大学内得各年纪人数分别为:一年级200人,二年级60人,三年级130人,四年级10人。则年级属性得众数就是:(A)A 一年级 B二年级 C 三年级 D 四年级 2、 下列哪个不就是专门用于可视化时间空间数
7、据得技术:(B)A 等高线图 B饼图 C曲面图 矢量场图 、 在抽样方法中,当合适得样本容量很难确定时,可以使用得抽样方法就是: ()有放回得简单随机抽样 无放回得简单随机抽样 C分层抽样 D 渐进抽样2、数据仓库就是随着时间变化得,下面得描述不正确得就是 (C)、 数据仓库随时间得变化不断增加新得数据内容;、 捕捉到得新数据会覆盖原来得快照;、 数据仓库随事件变化不断删去旧得数据内容;、数据仓库中包含大量得综合数据,这些综合数据会随着时间得变化不断地进行重新综合、2、 关于基本数据得元数据就是指:(D)、基本元数据与数据源,数据仓库,数据集市与应用程序等结构相关得信息;、 基本元数据包括与企
8、业相关得管理方面得数据与信息;、基本元数据包括日志文件与简历执行处理得时序调度信息;D、基本元数据包括关于装载与更新处理,分析处理以及管理方面得信息、3、 下面关于数据粒度得描述不正确得就是: (C)A、 粒度就是指数据仓库小数据单元得详细程度与级别;B、 数据越详细,粒度就越小,级别也就越高;C、 数据综合度越高,粒度也就越大,级别也就越高;D、 粒度得具体划分将直接影响数据仓库中得数据量以及查询质量、31、 有关数据仓库得开发特点,不正确得描述就是: (A)A、数据仓库开发要从数据出发;、数据仓库使用得需求在开发出去就要明确;C、 数据仓库得开发就是一个不断循环得过程,就是启发式得开发;、
9、 在数据仓库环境中,并不存在操作型环境中所固定得与较确切得处理流,数据仓库中数据分析与处理更灵活,且没有固定得模式32、 在有关数据仓库测试,下列说法不正确得就是: (D)、在完成数据仓库得实施过程中,需要对数据仓库进行各种测试、测试工作中要包括单元测试与系统测试、B、 当数据仓库得每个单独组件完成后,就需要对她们进行单元测试、C、系统得集成测试需要对数据仓库得所有组件进行大量得功能测试与回归测试、D、 在测试之前没必要制定详细得测试计划、3、 LP技术得核心就是: (D)A、 在线性;、 对用户得快速响应;C、互操作性、 多维分析;34、 关于LAP得特性,下面正确得就是:()(1)快速性
10、(2)可分析性 ()多维性(4)信息性 (5)共享性A、 (1) (2) (3)B、 () (3) (4)、 () (2) (3) (4)、 (1) (2) (3)(4) (5)5、 关于OLP与OLP得区别描述,不正确得就是: (C)A、 OLA主要就是关于如何理解聚集得大量不同得数据、它与TA应用程序不同、B、与OP应用程序不同,LTP应用程序包含大量相对简单得事务、C、 OAP得特点在于事务量大,但事务内容比较简单且重复率高、D、 LP就是以数据仓库为基础得,但其最终数据来源与TP一样均来自底层得数据库系统,两者面对得用户就是相同得、3、 OLAM技术一般简称为数据联机分析挖掘”,下面说
11、法正确得就是: (D)A、 OLAP与OL都基于客户机/服务器模式,只有后者有与用户得交互性;、由于OLAM得立方体与用于AP得立方体有本质得区别、 基于WEB得LAM就是B技术与OLAM技术得结合、D、 OLAM服务器通过用户图形借口接收用户得分析指令,在元数据得知道下,对超级立方体作一定得操作、37、 关于OLA与OP得说法,下列不正确得就是:(A)A、 OLAP事务量大,但事务内容比较简单且重复率高、B、OLAP得最终数据来源与OLTP不一样、C、 OLP面对得就是决策人员与高层管理人员、D、OLTP以应用为核心,就是应用驱动得、38、 设X=1,2,3就是频繁项集,则可由产生_()_个
12、关联规则.A、4 B、5 C、 D、7 0、 概念分层图就是_()图。A、无向无环 、有向无环 C、有向有环、无向有环41、 频繁项集、频繁闭项集、最大频繁项集之间得关系就是: (C)A、频繁项集 频繁闭项集=最大频繁项集B、频繁项集 = 频繁闭项集最大频繁项集C、频繁项集 频繁闭项集 最大频繁项集D、频繁项集 频繁闭项集 = 最大频繁项集42、 考虑下面得频繁3项集得集合:1,2,1,,4,,2,,1,3,4,1,3,5,2,3,,2,3,5,4,假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4项集不包含(C)、1,2,3,4B、1,2,3,5 C、1,2,4, 、1,4,54、
13、下面选项中t不就是s得子序列得就是(C )A、s= t,3,8B、s=,,3,5,6,t=2,8C、1,2,3,4 =D、=2,4,2,4=44、 在图集合中发现一组公共子结构,这样得任务称为( B )、频繁子集挖掘 、频繁子图挖掘 C、频繁数据项挖掘 、频繁模式挖掘4、 下列度量不具有反演性得就是 (D)A、 系数 B、几率 C、Ch度量、兴趣因子4、下列_(A)_不就是将主观信息加入到模式发现任务中得方法。、与同一时期其她数据对比B、可视化C、基于模板得方法D、主观兴趣度量7、 下面购物篮能够提取得3-项集得最大数量就是多少()D 购买项1 牛奶,啤酒,尿布2面包,黄油,牛奶3 牛奶,尿布
14、,饼干面包,黄油,饼干5 啤酒,饼干,尿布6 牛奶,尿布,面包,黄油7 面包,黄油,尿布8 啤酒,尿布9 牛奶,尿布,面包,黄油1 啤酒,饼干A、1B、 C、3D、48、 以下哪些算法就是分类算法,DSCAN B,C.5 C,Ma D,M (B)4、 以下哪些分类方法可以较好地避免样本得不平衡问题,,N B,VM C,Bayes D,神经网络 () 50、 决策树中不包含一下哪种结点,A,根结点(rot nde)B,内部结点(intnalnoe) C,外部结点(external noe) ,叶结点(eaf no) (C)51、不纯性度量中Gini计算公式为(其中就是类得个数) (A), B,
15、, D, ()3、 以下哪项关于决策树得说法就是错误得 (C)、 冗余属性不会对决策树得准确率造成不利得影响 B、 子树可能在决策树中重复多次 C、 决策树算法对于噪声得干扰非常敏感 D、 寻找最佳决策树就是NP完全问题54、 在基于规则分类器得中,依据规则质量得某种度量对规则排序,保证每一个测试记录都就是由覆盖它得“最好得”规格来分类,这种方案称为(B)A、 基于类得排序方案 B、 基于规则得排序方案 C、 基于度量得排序方案 、 基于规格得排序方案。 5、以下哪些算法就是基于规则得分类器 (A) A、 4、 B、 KNN C、a?ve BaesD、 AN56、 如果规则集R中不存在两条规则
16、被同一条记录触发,则称规则集R中得规则为(C);A,无序规则 ,穷举规则C,互斥规则 D,有序规则57、 如果对属性值得任一组合,R中都存在一条规则加以覆盖,则称规则集中得规则为(B)A,无序规则 ,穷举规则 C, 互斥规则 D,有序规则58、 如果规则集中得规则按照优先级降序排列,则称规则集就是 ()A,无序规则B,穷举规则 C, 互斥规则 D,有序规则9、 如果允许一条记录触发多条分类规则,把每条被触发规则得后件瞧作就是对相应类得一次投票,然后计票确定测试记录得类标号,称为(A) A, 无序规则 B,穷举规则 , 互斥规则 D,有序规则60、 考虑两队之间得足球比赛:队0与队1。假设65得
17、比赛队胜出,剩余得比赛队1获胜。队0获胜得比赛中只有30就是在队得主场,而队1取胜得比赛中75%就是主场获胜。如果下一场比赛在队1得主场进行队1获胜得概率为 (C)A,0、5 B,0。5 C,0、678 D, 0、73861、以下关于人工神经网络(ANN)得描述错误得有 ()A,神经网络对训练数据中得噪声非常鲁棒 ,可以处理冗余特征 ,训练ANN就是一个很耗时得过程 D,至少含有一个隐藏层得多层神经网络62、 通过聚集多个分类器得预测来提高分类准确率得技术称为(A) ,组合(enmbe) B,聚集(aggregate) C,合并(inti) D,投票(votig)63、 简单地将数据对象集划分
18、成不重叠得子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B ) 、层次聚类 B、划分聚类 C、非互斥聚类 D、模糊聚类6、 在基本K均值算法里,当邻近度函数采用(A )得时候,合适得质心就是簇中各点得中位数。 A、曼哈顿距离 、平方欧几里德距离 C、余弦距离 D、regman散度65、( C )就是一个观测值,它与其她观测值得差别如此之大,以至于怀疑它就是由不同得机制产生得。 A、边界点 B、质心 C、离群点 、核心点66、 BIRC就是一种( B )。 A、分类器 B、聚类算法 C、关联分析算法 D、特征选择算法、 检测一元正态分布中得离群点,属于异常检测中得基于( A )得离群
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 习题
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。