数据挖掘教学大纲.docx
《数据挖掘教学大纲.docx》由会员分享,可在线阅读,更多相关《数据挖掘教学大纲.docx(6页珍藏版)》请在咨信网上搜索。
数据挖掘教学大纲 一、课程概况所属专业:计算机科学与技术开课单位:数学计算机科学学院 课程类型:院系选修课程课程代码:07492210学分: 学分: 开课学期: 学时: 课堂讲授24+实验16 核心课程: 拟使用教材: Jiawei Han and Micheline Kamberz 著,范明,孟小峰译.Data mining: Concepts and Techniques (3nd edition).北京:机械工业出版社.2012.8 国内(外)现有教材: Jiawei Han and Micheline Kamber.Data Mining: Concepts and Techniques(影印 版).高等教育出版社.2001 学习参考资料: 著,王志海等译,《数据仓库》,机械工业出版社,2000 著,王天佑译,《数据仓库管理》,机械工业出版社,2002 [3]Pang-Ning Tan著,范明等译.数据挖掘导论.人民邮电出版社.2006 ⑷王珊.数据仓库技术与联机分析处理.清华大学出版社.2002 [5]安淑芝等•数据仓库与数据挖掘.清华大学出版社.2005 |6]二、课程描述 《数据挖掘》是计算机科学与技术专业的选修课程,后继于《数据库原理》,主要内容有常用数据处埋技术,分析提取数据中关联规那么,根据数据特征进行分 类与预测以及聚类。对学生了解计算机开展的前沿具有重要作用,也促进提高学 生独立分析、解决实际应用或者理论问题的能力。 三、课程目标 本课程的教学目的是使学生了解数据仓库与数据挖掘的产生和开展,了解数 据仓库与数据挖掘的作用;掌握数据仓库设计与实现的关键技术;掌握数据挖掘 的基本概念和方法;掌握几种主要数据挖掘算法并能应用于实际数据的处理;了 解局部变种数据挖掘算法的思路;最终能够胜任数据仓库设计与管理、数据挖掘 的工作。 四、教学要求 通过本课程的学习,要求学生初步掌握数据挖掘的重要概念和任务、数据挖 掘中的常用算法(决策树、关联规那么、范例推理、模糊聚类法、粗糙集、贝叶斯 网络、支持向量机、隐马尔科夫模型、进化和遗传算法、神经网络),以及数据 挖掘当前的研究动向。 依据本课程的教学目标、内容特点以及学生知识范围、主动性能动性等方面 特点,对授课教师“教”这一方面的要求有:(1)按照学校本科教学工作有关要 求做好课程教学各项工作;(2)多角度、多渠道学习、了解、掌握本领域相关前 沿知识,做好知识储藏工作;(3)授课过程力求内容充实、概念准确、思路清晰、 详略得当、逻辑性强、重难点突出,力戒平铺直叙、照本宣科;(4)重视对学生 的学习方法指导和课堂教学效果信息的反应,实现教与学的双向互动;(5)工程 驱动法、探究法等多种教学方法的深入或者结合使用。 对学生,,学”这方面的要求有:(1)认真阅读教材和参考资料,课前做好预 习,课上作好笔记,积极参与课堂案例讨论,课后按时完成书后每章的练习题和 教师补充的习题以及案例分析作业。(2)学习时要处理好全面和重点的关系、理 解和记忆的关系、理论方法和应用的关系,在全面学习的基础上掌握重点,在理 解的基础上记忆。不要死记硬背,要以理解基本原理和掌握分析方法为主。(3) 理论联系实际,结合上机实验,增强动手能力,提高理论理解水平。 五、考核方式及要求 为实现课程教学目标,本门课程考核方式及要求为:平时分40%+期末考试分60%。平时分包括:出勤率、作业完成情况、随堂测验。期末考试分卷面考试 与实践操作两局部,分别占总成绩的30%。 六、课程内容课堂讲授 第一章:引言 (授课时间:第六学期第一周)教学目标:了解在何种数据上进行数据挖掘、数据挖掘的功能、数据挖掘的分类、 数据挖掘的主要任务。 教学重点:在何种数据上进行数据挖掘、数据挖掘的分类教学难点:数据挖掘的分类 学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)什么是数据挖掘(2)在何种数据上进行数据挖掘 (3)数据挖掘的功能(4)所有模式都有趣吗 (5)数据挖掘的分类(6)数据挖掘的主要任务 学习方法:小组讨论、学习笔记、典型问题分析课后作业: 第二章:数据预处理(授课时间:第六学期第二周) 教学目标:掌握为什么要进行数据预处理,了解数据清理的作用、数据集成和转 换、数据归约、离散化和概念分层。 教学重点:为什么要进行数据预处理教学难点:数据归约、离散化和概念分层 学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)为什么要进行数据预处理(2)数据清理 (3)数据集成和转换(4)数据归约 (5)离散化和概念分层学习方法:小组讨论、学习笔记、典型问题分析 课后作业: 第三章:数据仓库和数据挖掘的OLAP技术 (授课时间:第六学期第三周) 教学目标:了解数据立方体技术,掌握多维数据模型、数据仓库的实现,数据仓 库的体系结构。 教学重点:数据仓库的体系结构教学难点:多维数据模型 学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)什么是数据仓库(2)多维数据模型 (3)数据仓库的体系结构(4)数据仓库的实现 (5)数据立方体技术(6)从数据仓库到数据挖掘 学习方法:小组讨论、学习笔记、典型问题分析课后作业: 第四章:挖掘大型数据库中的关联规那么 (授课时间:第六学期第四至六周)教学目标:了解有效的频繁项集挖掘方法,挖掘不同类型的关联规那么,从关联挖 掘到相关度分析,掌握基于约束的关联规那么挖掘。 教学重点:基于约束的关联规那么挖掘教学难点:从关联挖掘到相关度分析 学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)关联规那么基本概念(2)有效的频繁项集挖掘方法 (3)挖掘不同类型的关联规那么(4)从关联挖掘到相关度分析 (5)基于约束的关联规那么挖掘学习方法:小组讨论、实验操作(4学时) 课后作业: 第五章:分类和预测 (授课时间:第六学期第七至八周)教学目标:了解什么是分类?什么是预测,掌握基本决策树分类、贝叶斯分类、 后向传播分类、关联分类。 教学重点:决策树分类、贝叶斯分类教学难点:决策树分类、贝叶斯分类 学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)什么是分类?什么是预测(2)决策树分类 (3)贝叶斯分类(4)基于规那么的分类 (5)后向传播分类(6)关联分类 (7)精确度和错误度度量学习方法:小组讨论、实验操作(4学时) 课后作业: 第六章:聚类分析 (授课时间:第六学期第十至十二周) 教学目标:了解什么是聚类分析、主要的聚类分析方法分类,掌握基本划分方法、 层次方法、密度方法、异常点分析。 教学重点:划分方法、层次方法教学难点:划分方法、层次方法 学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法 主要内容:(1)什么是聚类分析(2)聚类分析的数据类型 (3)主要的聚类分析方法分类(4)划分方法 (5)层次方法(6)密度方法 (7)异常点分析学习方法:小组讨论、实验操作(4学时) 课后作业: 实验实验一:Microsoft SQL Server Analysis Services 的使用 (授课时间:第六学期第十至十一周)教学目标:学习并掌握Analysis Services的操作,加深理解数据仓库中涉及的一 些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机 分析处理等。 主要内容:在实验之前,先通读自学SQL SERVER自带的Analysis Manager概 念与教程。按照自学教程的步骤,完成对FoodMart数据源的联机分 析。建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析 数据。 学 时:4学时教学方法:演示法/讲授/现场指导 实验类型:验证性实验实验二:使用WEKA进行关联规那么分析 (授课时间:第六学期第十二至十三周) 教学目标:掌握数据挖掘平台WEKA的使用。综合运用数据预处理、关联规那么 挖掘算法、结果的解释等知识进行数据挖掘。从而加深理解课程中的 相关知识点。 主要内容:阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA, 针对实际数据,能够使用WEKA进行数据的预处理,了解属性选择, 能选择合适的关联规那么算法对数据进行分析,并能解释分析结果。 学 时:4学时教学方法:演示法/讲授/现场指导 实验类型:综合性实验实验三:使用WEKA进行分类与预测 (授课时间:第六学期第十四至十五周)教学目标:掌握数据挖掘平台WEKA的使用。综合运用数据预处理、分类与预 测的挖掘算法、结果的解释等知识进行数据挖掘。从而加深理解课程 中的相关知识点。 主要内容:阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA, 针对实际数据,能够使用WEKA进行数据的预处理,能选择合适的 分类与预测算法对数据进行分析,并能解释分析结果。 学 时:4学时教学方法:演示法/讲授/现场指导 实验类型:综合性实验实验四:数据挖掘算法的程序实现 (授课时间:第六学期第十六至十七周)教学目标:运用数据挖掘、程序设计等相关知识,选择一个数据挖掘的常用算法 进行程序设计实现。加深对数据挖掘算法基本原理、详细执行过程和 具体应用情况的理解 主要内容:采用任何一种自己熟悉的编程语言,完成算法的程序设计,并在每个 程序设计语句后面进行详细的注释。能够运用实现的算法来解决某个 具体的问题,得到并解释程序运行的结果。推荐的算法:1关联规那么: Apriori 算法;2 分类与预测:ID3,C4.5,KNN,BP; 3 聚类:k-means 学 时:4学时教学方法:演示法/讲授/现场指导 实验类型:设计性实验 实验三、四也可以继续在Microsoft SQL Server Analysis Services进行。- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 教学大纲
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文