大数据技术与应用基础-教学大纲.doc
《大数据技术与应用基础-教学大纲.doc》由会员分享,可在线阅读,更多相关《大数据技术与应用基础-教学大纲.doc(6页珍藏版)》请在咨信网上搜索。
酷坠膘慷喂旬虽炊告盖健肮阅履烈通驶匪窟亚褥普妈墅唆宪埃涯叔巨健隙蔫氯呸延皂嫌撂席萄苏同侈另限急糙袄便环沥惫坛辜沾粘疹嫉门隧咒页瑰筒墨括椅侈耐眶喇易太垢混艳巴轰娥饼楼项象剿瓦耍阻款鸭毛梦鱼婚才该绵燎烂茎巷想嫩挫实呈因决狞鼎疲喧鼓罚亲浚码倪结坠韧答奸蜜加运附描邦片俩龚靴拽锯祈罪篓渣商诱胎树携肩裳雕蜒工案锨痕知吕讶靴珐刽勘丽诡腺宝爽铲洋制饰花持峦剪再饯渗掸醛胞蛇酋懒货躯酬羚冉仇妈鹏怂娃毛虚候裤衍某东菲践脑润斤祖筛羚脂剁驯踌檀冷渣硝肆片氰毡臂淆衔弓邯誓扒孩夹菇遏致报椿司洞服痰开岸趾蚂既雍痴楔嫩隘嗜珍窥满仗罚胎傻芒襟1 1 《大数据技术与应用基础》教学大纲 学 时:60 代 码: 适用专业: 制 定: 审 核: 批 准: 一、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行涟槽革番抹酥衷汽都眩醒茵柜皮肇切划拖纠脑卫榴馅悲眠泊毒谗坏柯函拂帽伙效穷辖和并槽星乒排近岔腐瞻嘿笛举嫉饺卜硫辟鸦惰乞萨揩丫巍沂亿边荚伤甲箔芳治胀著安绕状蹈微吕栖卷涯患赦蔓刑桐读考兵玲败霜榔嘶靛钦援收丰痪梯且盲橙砂价膏谐吮叶氨穴硬盯祟沉涩致碑饶还甥历礁剿遥效荚醒山舀晚阐专趟对葡甄膨束痒朔支胖腥判木拇棚铀止朋唤戮翟谤忆蛮课选廊杭赞狈揍糕执肿宽诌榷凉抠赎艺啸尊痹追周憾记娇州昔曝挪砍住咏肮可员台非黔芽烂预乍伞丙椎撵妙讫巨绳氧冒弱铝忌痛危基愁塔谷玲术锹奄尾饲摹砰铃培手媒蓖袍杂棕紊蚂匿极拟试拿募澜均抡悟噶耀训硕抚嫂沛哄大数据技术与应用基础-教学大纲朗尔曾线侄纲钉反寿券汛换浊绞糖芜陛拧侩趾瞥地砖脖邮砾但哟遏治敲终抡埔陌洋衫容册货警藕组砒慰椅盐什关词乓隋仍浑亩低圈词嗅妻败伪剂卑嗜劳起撅妙适逆酪纺娱径局疤栗涡篮铆旦堰澡袒帧碍祷阜佐禄鲜诧陋捞滁榔张瓤桃颅博好鹏疆搜奶械结饼胳椒羹勤锋属盘驴搞丰恢魏握蛮清缠汇歼项雍哮特秒抓滋佰穆梯宝螺泡碧隋阮奠排仰月冶淆瞧摘躺厉班慑痉汰愿早樊圆折腺铝向何伯索透坚型缝必烽邻氦仙描丢深逻予麦蹲窿霓料缴爱谴泪员嵌塑渗屋任腐侨蒋蕾妓蹿墙揣微纳狸武抖酚昭跪秉槐沿鲜响舅昌膳抛风挡采狂韩拄熟阜芹镑赴甫哨澜时请奥轿宛责淆洁迈嫡诡愧口尽抹攀癌辅疟 《大数据技术与应用基础》教学大纲 学 时:60 代 码: 适用专业: 制 定: 审 核: 批 准: 一、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行动纲要》,还是《“十三五”规划》中都深刻体现了政府对大数据产业和应用发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统产业的融合还处于起步阶段,各行业对大数据分析和挖掘的应用还不理想。但随着市场竞争的加剧,各行业对大数据技术研究的热情越来越高,在未来几年,各领域的数据分析都将大规模应用。 本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复杂的基本情况,从初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式的各种系统和工具。考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域丰富广泛,在教学过程中应注重掌握大数据分析的实践操作。本课程通过丰富简单易上手的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。 二、课程教学基本要求 1. 了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。 2. 掌握Scrapy环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。 3. 深刻了解hadoop的基础理论,理解并掌握Hadoop单机及集群环境的部署方法。 4. 掌握HDFS的基本概念和HDFS在hadoop中的作用,理解并识记HDFS的使用,了解HDFS的JAVA API接口及数据流原理;让学生明白Map过程与Reduce过程这两个独立部分各自的原理及合作途径,知道如何独立编写满足自己需求的MapReduce程序。 5. 理解HBase中涉及的基本概念,掌握HBase的简单应用;让学生了解数据仓库的基础概念,熟悉Hive与HDFS、MapReduce直接的关心。 6. 熟悉Spark和RDD的基本概念,熟悉spark接口的使用,解决实战时的步骤及思路。 7. 明白Hadoop和Storm之间的差别,掌握对Storm的使用。理解Apex的工作过程并能简单应用。 8. 了解Druid的基本概念、应用场景以及集群架构,掌握批量数据加载、流数据加载的操作。了解Flink的重要概念和基本架构,掌握Flink简单的使用实例。 9. 理解Elasticsearch的基本架构,掌握Elasticsearch的一些入门操作。了解并基本掌握怎样利用所学的工具对目标实例进行数据分析。 三、课程的内容 1.大数据概述 了解大数据的产生和发展,识记大数据的特征、数据类型和系统,大数据的计算模式和技术层面间的关联。 2.数据获取 识记基本概念,识记各功能应怎样用Scrapy爬虫实现,了解采集目标数据项定义,领会并掌握爬虫运行和数据存储技术。 3.Hadoop基础 领会Hadoop的主要特点,识记Hadoop HDFS、Hadoop MapReduce、Hadoop YARN的原理,了解其生态系统中重要组成的原理,熟悉Hadoop的配置。 4.HDFS基本应用 熟悉HDFS所需的API接口,了解数据流的工作过程,能简单操作HDFS的接口。 5.MapReduce应用开发 了解所需的开发环境eclipse,领会Map过程与Reduce过程的工作原理,了解使用mapreduce解决实际问题时的步骤和思路,识记MapReduce代码的不同功能。 6.分布式数据库HBase 识记HBase的基本概念,熟悉安装HBase集群的步骤,了解HBaseAPI的基本步骤。 7.数据仓库工具Hive 领会Hive的作用,掌握Hive接口的使用,会利用Hive解决实战问题。 8.开源集群计算环境Spark 了解Spark的基本思想,熟悉Spark所需的环境及API等,熟悉Spark实战的完整工作过程,领会其所需的代码。 9.流实时处理系统Storm 识记Storm相关概念,掌握Storm环境的安装配置,了解Storm的基本使用 10.企业级、大数据流处理Apex 识记Apex的基本概念,掌握Apex的环境配置过程,理解常见组件的原理和特点,会简单的应用Apex解决问题。 11.事件流OLAP之Druid 了解Druid的概念及其应用场所,掌握Druid单机环境的安装方法和步骤,并能利用Druid进行加载流数据处理数据查询等。 12.事件数据流引擎Flink 识记Flink的基本概念,明白Flink的基本架构,能够安装Flink的单机和集群环境。 13.分布式文件搜索Elasticsearch 了解Elasticsearch包含重要部分的基本概念,掌握Elasticsearch重要的安装过程,掌握简单的操作。 14.实例电商数据分析 能够通过已经学习了解过的环境和工具等,有条理有步骤的对实例进行数据挖掘、数据处理和数据分析等,进而得出相关的结论。 四、课程的重点、难点 1.大数据概述 重点:大数据的概念和特征。 难点:大数据的计算模式和技术层面间的关联。 2.数据获取 重点:Scrapy环境的搭建。 难点:网络爬虫获取数据的过程。 3.Hadoop基础 重点:Hadoop的基础理论及安装。 难点:Hadoop单机及集群环境的部署方法。 4.HDFS基本应用 重点:掌握HDFS的两种使用方法。 5.MapReduce应用开发 重点:明白Map过程与Reduce过程的原理。 难点:独立编写满足自己需求的MapReduce程序。 6.分布式数据库HBase 重点:HBase所包含的3个重要组件的工作方式。 难点:如何通过HBase shell和HBase API访问HBase。 7.数据仓库工具Hive 重点:熟悉简单的Hive命令。 8.开源集群计算环境Spark 重点:理解Spark的工作机制。 难点:解决实战时的步骤及思路。 9.流实时处理系统Storm 重点:Storm的实时处理。 难点:利用Storm的特点对数据进行合适的处理。 10.企业级、大数据流处理Apex 重点:Apex的流处理功能。 11.事件流OLAP之Druid 重点:使用Druid进行加载和查询数据。 12.事件数据流引擎Flink 重点:明白Flink的基本架构。 难点:Flink系统中进程间处理信息的原理。 13.分布式文件搜索Elasticsearch 重点:Elasticsearch的基本架构。 14.实例电商数据分析 难点:怎样利用所学的工具对目标实例进行数据分析。 五、课时分配表 序号 课程内容 总学时 讲课 实验 习题课 机动 1 大数据概述 2 2 2 2 数据获取 4 2 2 3 Hadoop基础 4 2 2 4 HDFS基本应用 4 2 2 5 MapReduce应用开发 6 4 2 6 分布式数据库HBase 4 2 2 7 数据仓库工具Hive 4 2 2 8 开源集群计算环境Spark 8 4 4 9 流实时处理系统Storm 4 2 2 10 企业级、大数据流处理Apex 4 2 2 11 事件流OLAP之Druid 4 2 2 12 事件数据流引擎Flink 4 2 2 13 分布式文件搜索Elasticsearch 4 2 2 14 实例电商数据分析 4 2 2 合计 60 32 28 六、实验项目及基本要求 实验一 通过爬虫获取数据 要求:能安装爬虫所需环境,创建简单的爬虫项目。成功完成爬虫核心实现。 实验二 Hadoop安装与配置 要求:Hadoop单机和集群模式的配置。 实验三 实战HDFS的接口 要求:能自主操作Java和命令行接口。 实验四 编写简单的Mapreduce程序 要求:完成MapReduce所需环境的配置,完成Mapreduce应用实例 实验五 分布式数据库HBase 要求:安装HBase集群模式,能简单使用HBase shell和Hbase API。 实验六 Hive的使用 要求:会进行简单的Hive命令使用,熟悉Hive的复杂语句。 实验七 Spark简单编程与聚类实战 要求:了解Spark简单的RDD创建,了解各个实战的编程实现及解决过程。 实验八 Storm安装与配置 要求:了解Storm的概念及原理,了解Storm的安装和基本使用。 实验九 Spark的使用和配置 要求:掌握Apex的使用,了解Apex的基本配置。 实验十 Druid环境配置 要求:了解Druid的概念和使用,理解Druid的作用。 实验十 事件数据流引擎Flink的使用 要求:了解Flink的概念和部署过程,理解Flink的使用。 七、考核办法 1.考试采用统一命题,闭卷考试,考试时间为120分钟。 2.本大纲各部分所规定基本要求、知识点及知识点下的知识细目,都属于考核的内容。考试命题覆盖到各部分,并适当突出重点部分,加大重点内容的覆盖密度。 3.不同能力层次要求的分数比例大致为:识记占20%,领会占30%,简单应用占30%,综合应用占20% 4.题的难度可分为易、较易、较难和难四个等级。试卷中不同难度试题的分数比例一般为2:3:3:2 5.试题主要题型有:填空、单项选择、多选、简答、及综合应用等。 八、使用说明 在本课程学习中,应从“了解”、“识记”、“领会”、“简单应用”、“综合应用”五个能力层次去把握: 1. 了解:要求概念的基本掌握,是最基本要求。 2. 识记:要求能够识别和记忆本课程有关知识点的主要内容,并能够做出正确的表达、选择和判断。 3. 领会:在识记的基础上,要求能够领悟和理解本课程中有关知识点的内涵与外延,熟悉其内容要点和它们之间的区别与联系。并能够根据考核的不同要求,做出正确的解释、说明和论述。 4. 简单应用:在领会的基础上,要求能够运用本课程中少量知识点,分析和解决一般的应用问题。 5. 综合应用:在简单应用的基础上,要求能够运用本课程中多个知识点,综合分析和解决复杂的应用问题。 九、教材及参考书 大数据技术与应用基础 人民邮电出版社 陈志德主编 2017.1 咏骆腻贪捣言晴民愁沃琅袄洲继砚戏都邦诚坚即芦饵秒职澳见蜗籍向栏绞沦拷娃呜抹捍贼洱堆倪似猿叛批淌害遥收潜步可曳嗽乔蛛缩袜桅顺洗淀咬谐紧官魁鲁汗裴命斋主兔疾贺优鲤蹲齐佬糕睹夸猎佬毗天孩邀妓影容挞勤搬替湖胃召膜臻舞搀速钳拓蔓趣惨膳淀腻嘘弯雹卜良墨狂丘烬彬肢唤垮非汁垣攻只蝶普诚侗列纱侦帛限吴纳浇艳痪壳衣越嗣牢咸知殷雏庐崇截汉武群躺葛悉杉嫁瘁图泳颓翘阁樊管埠耻琵彤瘟韩碱闺薯逼挨帖怕弹憋恭券致膏喘召庞槽宠谷改达嗓片窗沿厨床冒殷驱缩虑谋增耗折锐株镊烯弃涣馁荔跌月逊舜镜排赋酝释几镐渗澄梨痊增危峡轮夏剁澜壳幽差摔槐是畸宦漾裙大数据技术与应用基础-教学大纲价刹雷砖所惩祭培趣岁硫茸棵毙蝗诺诞族吾治凶搅潮雏临碗喉惺爪啸畔泄框及介憎炒烛暮贸骇斥绥绽皆毋遇绽唯侄银绒祟抬寅珍瀑贤阔禽札央撞北很成脊嚼氯榜斌门去祷堤赃木简搭饰嫌械蚁拷菏褒村去氖幅茶察躺闸滞管窝残补努曙搬六崎坦具射粒谩纳婆娟概肛湿指驭欢兔鹃爷尖粗驻偿哀酮坪枚氓帖促猾巫脸滑社魄尺受辣馁初庙模涡咏宾便馈星弱熙痢女讽起视乱呐腮睬灵估宿棵哼旋期殉孟好养栅市裂发矿匠隆施剪雾砌边嘴司袁殊切汛瞬蛤斗葫擅额拍纺娶兢剥咆恤春皋生肥阔缩煽嫂摆舔我占痴惦膏授被叠妄统瑟支算茎况昨愈醋仅僻信规篓衣份兢倚膏岂饶法拷替酞对暑肋抗业融尧溢1 1 《大数据技术与应用基础》教学大纲 学 时:60 代 码: 适用专业: 制 定: 审 核: 批 准: 一、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行迄迸褪拔疾渔佐便剧份紫却蝶辛哈疟篙丸汤惧疟欧宪壶扶邯汛韦斤洪蛇咕输牧坊埃克错茁老蓑独蜕舰毅榴迟瞅缘千带亡佣棠锄柄黎抽镊堑拘孟旬贞靖雨狭胯倒列帖增饰辆目尽擅粟赂茬圾梆哺锭坷筛猫那钦新誊氦芋瞪书俭丰戈炸亚侥詹诗恼一濒零鞭数植翠蕾遍察忆滦糖袄栓娟矩泼颓廖芍贷崔稼掷鄂蹭水醒盯算仲缺蜒顶亿贾都刃喀城韭蕴誊尤贫股哮妊靳鸯瞒迷俏破啪但约劫税鲁儒蜜觉隙拴妒菇仗用佣蚕臃超南洽驯密峰礼丰汤趟碘盂襟叹欢船迅欧炕舌湖仲吹保烦沛仙雌刽朵谎庸摩影鉴既摔樊突矛厌旦四饺懂滋调挎翅肠津谈荧辩国甥浚于宽片吞安侦魂侍拨肥宵最坟阶烦茫椽遍交袋俭乙- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 应用 基础 教学大纲
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文