《大数据挖掘》教学大纲.docx
《《大数据挖掘》教学大纲.docx》由会员分享,可在线阅读,更多相关《《大数据挖掘》教学大纲.docx(6页珍藏版)》请在咨信网上搜索。
大数据挖掘 (Big Data Mining) 课程代码:5251058 学分:3 学时:48 (其中:课程教学学时:32,实验学时:16) 先修课程:《数据库原理》、《概率论与数理统计》、《SAS软件基础》 适用专业:计算机科学与技术 教材:《Oracle数据库应用与实践》,方巍,文学志编著,清华大学出版社, 2014年8月第1版 开课学院:计算机与软件学院 一、课程性质与课程目标 <-)课程性质 大数据挖掘是高等工科院校计算机类相关专业的一门专业选修课程。本课程主要介绍本 课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应用。 (二)课程目标 课程目标包括知识目标和能力目标,具体如下: 课程目标1:能够针对相关问题选取合适的数据挖掘算法分析数据,通过比照做出归纳 性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。 课程目标2:提高对生活、学习和工作中产生的大数据的分析和处理能力。 (三)课程目标与专业毕业要求指标点的对应关系 本课程支撑专业培养计划中的毕业要求指标点4.2和5.2。 毕业要求指标点42具有计算机软硬件及系统相关的工程基础能力,能够针对计算机 领域相关问题进行实验验证与实现,能够利用理论分析手段对实验数据进行解释与比照分析, 给出实验结论。 毕业要求指标点5.2:在计算机领域复杂工程问题的建模、模拟或解决过程中,能够使 用恰当的技术、软硬件及系统资源和研发工具,提高解决复杂工程问题的能力和效率。 毕业要求箱派点、 课程目标1 课程目标2 毕业要求11.3 二、课程内容及教学要求(按章撰写) 本课程教学内容包括:数据挖掘的基本理论、常用挖掘算法及其应用。 本课程基本要求是:理解数据挖掘的基本概念和方法,掌握数据挖掘算法基本原理及其 实现,并能借助算法对数据进行分析和处理。学生能够借助SAS Enterprise Miner软件工具 进行具体数据的挖掘分析,从中获取有价值的信息。 第1章数据挖掘导论(一)教学内容 1 .数据挖掘开展概述。 2 .数据挖掘功能。 3 .数据挖掘系统。 (二)教学要求.了解数据挖掘基本概念。 1 . 了解数据挖掘开展历程。 2 .熟悉数据挖掘的基本功能。 3 . 了解数据挖掘系统及分类。 (三)重点与难点.重点 数据挖掘功能。 1 .难点数据挖掘系统应用。 第2章数据预处理(一)教学内容 1 .数据清洗:噪声数据处理、不一致数据处理。 2 .数据集成与转换。 (二)教学要求.熟悉噪声数据处理方法。 1 .熟悉不一致数据处理方法。 2 .了解数据集成方法。 3 . 了解数据转换方法。 (三)重点与难点.重点 数据清洗方法。 1 .难点 数据转换方法。 第3章分类与预测 (-)教学内容 1 .分类与预测基本知识。 2 .分类:基于决策树的分类、贝叶斯分类、支持向量机分类、神经网络分类、预测方 法。 (二)教学要求 1 .掌握分类的基础知识。 2 .掌握预测的基础知识。 3 .理解常用分类和预测方法。 (三)重点与难点.重点 支持向量机分类方法。 1 .难点神经网络分类方法。 第4章聚类分析(一)教学内容 聚类分析基础与应用:K-Means聚类方法、K-中心点聚类方法。 (二)教学要求 1 .掌握K-Means聚类方法原理、实现及应用。 2 .掌握K-中心点聚类方法原理、实现及应用。 (三)重点与难点.重点 K-Means聚类方法。 1 .难点K・中心点聚类方法。 三、本课程开设的实验工程 编号 实验工程名称 学时 类型 要求 支撑的课程目标 1 演化分析 2 综合 必做 课程目标1 2 数据清洗 2 综合 必做 课程目标1 3 数据集成与转换 2 综合 必做 课程目标1 4 基于决策树的分类 2 综合 必做 课程目标1, 2 5 贝叶斯分类 2 综合 必做 课程目标1, 2 6 支持向量机分类 2 综合 必做 课程目标1, 2 7 K -Means聚类算法 2 综合 必做 课程目标1,2 8 K一中心点聚类算法 2 综合 必做 课程目标1,2 实验1:演化分析 1 .实验目的及要求 2 )熟悉演化分析的基本方法; 3 )掌握演化分析软件使用方法。 4 .实验主要内容 使用SAS软件对数据集进行演化分析。 5 .重难点 SAS软件使用方法。 实验2:数据清洗.实验目的及要求 1)掌握噪声数据处理方法;2)掌握不一致数据处理方法。 1 .实验主要内容使用SAS软件分别对噪声数据和不一致进行处理。 2 .重难点噪声数据的处理。 实验3:数据集成与转换.实验目的及要求 1)掌握数据集成方法;2)掌握常用数据转换方法。 3 .实验主要内容使用SAS软件分别完成数据的集成和转换。 4 .重难点数据转换。 实验4:基于决策树的分类.实验目的及要求 1)掌握ID3算法原理与实现;2)掌握C4.5算法原理与实现。 5 .实验主要内容分别使用ID3算法和C4.5算法对给定的训练数据集创立决策树。 6 .重难点C4.5算法创立决策树。 实验5:贝叶斯分类实验目的及要求 1)掌握贝叶斯算法分类原理;2)掌握贝叶斯算法的实现及应用: 7 实验主要内容基于给定的训练样本集使用贝叶斯分类算法对给定数据进行分类。 8 重难点贝叶斯分类准那么。 实验6:支持向量机分类实验目的及要求 1)掌握支持向量机的基本原理;2)熟悉支持向量机代码; 3)掌握k-交叉验证法选取最正确参数方法。 9 实验主要内容从网上下载支持向量机代码和实验数据集,完成训练和测试过程。 10 重难点k-交叉验证法选取最正确参数方法。 实验7: K—Means聚类算法实验目的及要求 1)掌握K-Means聚类算法原理;2)熟悉K-Means聚类算法代码及应用。 11 实验主要内容对给定的实验数据集,使用K-Means聚类算法完成聚类操作。 12 重难点聚类中心的更新及误差准那么函数计算。 实验8: K—中心点聚类算法实验目的及要求 1)掌握K —中心点聚类算法原理;2)掌握K ―中心点聚类算法代码及应用。 13 实验主要内容对给定的实验数据集,使用K—中心点聚类算法完成聚类操作。 14 重难点中心点替换代价计算。 注:本课程为专业方向课,授课对象为大三学生,实验类型主要包括验证性和设计性实 验,均需要提交实验报告,实验报告主要包括实验目的、实验内容、预习内容、实验步骤、 实验结果以及总结。实验评价内容和评分细那么参见附录1。 四、学时分配及教学方法 章 教学形式及学时分配 主要教学方法 支撑的课程目 标 课堂 教学 实验 上机 课程 实践 小计 第1章数据挖掘导论 8 8 讲授、自学 课程目标1 第2章数据预处理 8 6 14 讲授、自学、演示 课程目标1, 2 第3章分类与预测 8 6 14 讲授、演示、自学、 讨论、实验 课程目标1, 2 第4章聚类分析 8 4 12 讲授、演示、自学、 实验 课程目标1,2 合计 32 16 48 注:1.课程实践学时按相关专业培养计划列入表格;2.主要教学方法包括讲授法、讨论法、演示法、研究型教学方法(基于问题、工程、案 例等教学方法)等。 五、课程考核1.课程考核方式包括期末考试、平时作业和实验情况考核。 考核形式 考核要求 考核权重 备注 平时作业 及阶段测 试 课后完成10-15个习题,主要考核学生对每节课知识点 的复习、理解和掌握度,计算全部作业的平均成绩再按 15%计入总成绩;可让学生查阅资料,了解本课程相关 技术开展情况,自主学习并完成。 15% 根据平时作业得 分取平均值或结 合平时测试情况 实验 完成8个实验,主要训练学生应用所学知识构建实验系 统,并进行实验的能力,最后按15%计入课程总成绩。 15% 评分细那么见附录1 课程论文 课程论文的70%计入课程总成绩。其中考核对算法原理 的理解和分析占90%:考核能针对个人或职业开展的需 求,采用合适的方法,自主学习,适应开展占比10%。 70% 参照综述论文撰 写格式提交课程 论文 六、参考书目及学习资料.张云涛、龚玲著,《数据挖掘原理与技术》,电子工业出版社,2004. 1 .陈京民编著,《数据仓库与数据挖掘技术》,电子工业出版社,2002o.林杰斌主编,《数据挖掘与OLAP理论与实务》,清华大学出版社,2003.1o 2 .朱明编著,《数据挖掘》,中国科学技术大学出版社,2002.2c 3 . Richard J. Roiger, Michael W. Geatz著,翁敬农译,《数据挖掘教程》,清华大学出版 社,2003。 4 . David Hand, Heikki Mannila, Padhraic Smyth 著,张银奎、廖丽、宋俊等译,《数 据挖掘原理》,机械工业出版社,2003。 七、大纲说明 1 .主要采用多媒体教学手段,主要知识点板书与多媒体相结合,多种教学手段综合运 用。 2 .课后共需完成近15道习题作业,以评价学生对所学内容的理解和应用情况。 附录1 :实验考核方式及评分细那么 本实验以考查为.主,考核的内容包括实验过程的表现(其中包含分析与解决问题的能力)、 实验报告的质量等。分析与解决问题的能力采用提问和现场操作的方式进行。实验成绩中出 勒、预习占10%,实验过程表现占60%、实验报告及思考题占30%。 成绩组成 考核/评价环节 分值 考核/评价细那么 对应的毕业 要求指标点 出勤、预 习10% 出勤状况, 预习评价 10 能按时到勤,遵守‘实验规定,不损坏实验设备(占 5%);能够预习,并理解实验原理及目的(占5%)o 4.2 实验过程 60% 实验中的表现 60 按照预设方案操作实验设备、仪表,正确完成实 验(占25%):实验结果的准确性(占20%);利 用所学知识分析解决问题的能力(占15%)。各个 实验在总分中所占权重系数以课时数为标准。 4.2, 5.2 实验报告 30% 实验报告评价 30 主要考察学生对数据进行分析和处理的能力。要 求报告格式规范(占10%);操作准确(占10%); 并按要求完成相应思考题(10%)。 4.2, 5.2- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据挖掘 数据 挖掘 教学大纲
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文