《大数据挖掘原理实践》教学大纲.docx
《《大数据挖掘原理实践》教学大纲.docx》由会员分享,可在线阅读,更多相关《《大数据挖掘原理实践》教学大纲.docx(5页珍藏版)》请在咨信网上搜索。
大数据挖掘原理实践 (Theoretical Practice of Big Data Mining)课程代码:7251085 学分:1学时:16 (其中:课程教学学时:0,课程实践学时:16) 先修课程:《数据库原理》、《概率论与数理统计》适用专业:计算机科学与技术 教材:David Hand, Heikki Mannila, Padhraic Smyth 著,张银奎、廖丽、 宋俊等译,《数据挖掘原理》,机械工业出版社,2003开课学院:计算机与软件学院 一、课程性质与课程目标(-)课程性质 大数据挖掘原理实践是计算机类专业的算法实现及应用课程。课程实践的主要内容:分 别完成关联规那么挖掘系统、支持向量机分类系统以及数据聚类系统的设计和实现。 该门课程通过实践环节,使学生在了解大数据挖掘课程理论基础上,深入掌握大数据挖 掘的原理。使用理论课的基础知识的方法及步骤,进一步加深对大数据挖掘有关概念和理论 的理解,并且使学生能够提高运用大数据挖掘解决实际问题的能力,并为毕业设计做准备。 (二)课程目标课程目标包括知识目标和能力目标,具体如下: 课程目标1:通过对相关问题的分析,选取合适的数据挖掘方法,通过系统实现及公共 数据集得到相关的测试结果,并能对测试结果进行分析和有效性比拟。 课程目标2:通过对算法在公共数据集上的测试结果比拟,能够分析算法的优点和局限 性。 (三)课程目标与专业毕业要求指标点的对应关系本课程支撑专业培养计划中的毕业要求指标点4.4和5.3。 毕业要求指标点44针对设计或开发的解决方案,能够通过理论证明、实验仿真或者 系统实现等多种科学方法说明其有效性和合理性,并对解决方案的实施质量进行分析,通过 信息综合得到合理有效的结论。 毕业要求指标点5.3:能够分析复杂工程问题所使用的技术、资源和工具的优势和缺乏, 理解其局限性。 毕业要求输点、 课程目标1 课程目标2 毕业要求4.4 毕业要求5.3 二、本课程开设的实验工程 编号 实验工程名称 学时 类型 要求 支撑的课程目标 1 关联规那么挖掘系统 4 综合性 必做 课程目标1, 2 2 支持向量机分类系统 6 综合性 必做 课程目标1 3 数据聚类系统 6 综合性 必做 课程目标1, 2 实验1:关联规那么挖掘系统1.实验目的及要求 1)掌握Python GUI编程;2)理解关联规那么挖掘原理及实现方法; 3)所有操作要求通过用户界面实现;4)关联规那么挖掘算法要求可从两种经典算法Apriori或FP-Growth中任意选取; 5)可自行设置最小支持度计数和最小置信度参数值;6)输出:各个频繁项集、强关联规那么; 7)课堂上提交系统代码并阐述设计思路。 2 .实验主要内容自学Python GUI编程,设计并实现一个基于GUI的关联规那么挖掘系统。 3 .重难点1)重点 算法的实现方法。 2)难点图形用户界面设计。 实验2:支持向量机分类系统1.实验目的及要求 1)理解支持向量机的原理;2)运用支持向量机解决分类问题; 3)训练过程采用K-交叉验证法选取最优参数组合; 4)训练过程中可自行设置参数值及SVM参数的取值范围; 5)要求输出:最正确参数组合值、分类准确率、虚警率、ROC曲线、AUC值; 6)撰写完整的科技报告表述自己的算法设计、算法实现与算法评估过程,报告的内容 包括任务描述、问题分析、算法设计、算法实现以及程序运行结果及分析; 7)提交源程序工程文件和课程设计报告。 2 .实验主要内容自学Python GUI编程,设计并实现一个基于GUI的支持向量机分类系统。。 3 .重难点1)重点 算法的实现方法。 2)难点使用K-交叉验证法选取最优参数。 实验3:数据聚类系统.实验目的及要求 1)理解并掌握各种数据聚类算法;2)灵活运用所学聚类方法解决实际问题; 3)可自行选取聚类算法; 4)不同的聚类算法要求使用不同的操作界面; 5)可自行设置参数值; 6)撰写完整的科技报告表述自己的算法设计、算法实现与算法评估过程,报告的内容 包括任务描述、问题分析、算法设计、算法实现以及程序运行结果及分析; 7)提交源程序工程文件和课程设计报告。 2 .实验主要内容分别使用K-means聚类算法和K-中心点聚类算法实现数据的聚类操作。 3 .重难点1)重点 图形用户界面设计。 2)难点对不同的应用选取最正确距离度量函数。 注:本课程为学科专业选修课,授课对象为大三的学生,实验类型主要是综合性实验, 最终提交的课程实践报告主要包括数据关联规那么算法应用、支持向量机分类算法和聚类算法 应用。 三、课程考核 本课程采用考勤、实验完成情况与课程报告相结合的方式进行评价,成绩评 定采用百分制,其中考勤成绩占比20%,系统演示成绩占比40%,课程报告成绩 占比40%o考勤成绩评价方式、实验完成情况评价方式和课程报告评价方式如表 1所示。 表1课程实践评价方法 类别 所占比例 级别 评分规那么 考勤 20% 优 满勤 良 缺勤1次 中 缺勤2次 及格 缺勤3次 不及格 缺勤次>3次 系统 演示 情况 40% 优 能够按照GUI设计方案开发,系统功能完全实现。 良 能够按照GUI设计方案开发,系统功能略有欠缺。 中 能够基本按照GUI设计方案开发,系统功能略有欠 缺。 及格 能够基本按照GUI设计方案开发,系统功能不完善。 不及格 不能够基本按照GUI设计方案开发,无演示效果。 课程 报告 40% 优 报告格式规范;按要求及时提交。 良 报告格式基本规范;按要求及时提交。 中 报告格式基本规范,但GUI设计缺少图表等;按要 求及时提交。 及格 报告格式基本规范,但GUI设计缺少图表等;且没 有按要求及时提交。 不及格 报告格式不规范;没有按要求及时提交。 表2实验工程与毕业要求指标点对照关系及分值分布表 实验工程名称 对应毕业要求指标点 分值 关联规那么挖掘系统 4.4, 5.3 30 支持向量机分类系统 4.4 35 数据聚类系统 4.4, 5.3 35 四、参考书目及学习资料.张云涛、龚玲著,《数据挖掘原理与技术》,电子工业出版社,2004o 1 .陈京民编著,《数据仓库与数据挖掘技术》,电子工业出版社,2002o.林杰斌主编,《数据挖掘与OLAP理论与实务》,清华大学出版社,2003.1o 2 .朱明编著,《数据挖掘》,中国科学技术大学出版社,2002.2o 3 . Richard J. Roiger, Michael W. Geatz著,翁敬农译,《数据挖掘教程》,清华大学出版 社,2003 o 4 . David Hand, Heikki Mannila, Padhraic Smyth 著,张银奎、廖丽、宋俊等译,《数据 挖掘原理》,机械工业出版社,2003o- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据挖掘原理实践 数据 挖掘 原理 实践 教学大纲
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文