Chapter厦门大学林子雨大数据技术原理与应用第五.pptx
《Chapter厦门大学林子雨大数据技术原理与应用第五.pptx》由会员分享,可在线阅读,更多相关《Chapter厦门大学林子雨大数据技术原理与应用第五.pptx(30页珍藏版)》请在咨信网上搜索。
1、大数据技术原理与应用 厦门大学计算机科学系 林子雨 提纲5.1 NoSQL简介简介5.2 NoSQL兴起的原因兴起的原因5.3 NoSQL与关系数据库的比较与关系数据库的比较5.4 NoSQL的四大类型的四大类型5.5 NoSQL的三大基石的三大基石5.6 从从NoSQL到到NewSQL数据库数据库本章小结本章小结欢迎访问大数据技术原理与应用教材官方网站:http:/ 林子雨 编著,人民邮电出版社ISBN:978-7-115-39287-9大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.1 NoSQL简介通常,NoSQL数据库具有以下几个特点:(1)灵活的可扩展性)灵活的可扩展性(2)
2、灵活的数据模型)灵活的数据模型(3)与云计算紧密融合)与云计算紧密融合大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.2 NoSQL兴起的原因1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:(1)无法满足海量数据的管理需求)无法满足海量数据的管理需求(2)无法满足数据高并发的需求)无法满足数据高并发的需求(3)无法满足高可扩展性和高可用性)无法满足高可扩展性和高可用性的需求的需求2、关系数据库的关键特性包括完善的事务机制和高效的查询机制。但是,关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要表现在以下几个方面:(1)Web2.0网站系统通常不
3、要求严格的数网站系统通常不要求严格的数据库事务据库事务(2)Web2.0并不要求严格的读写实时性并不要求严格的读写实时性(3)Web2.0通常不包含大量复杂的通常不包含大量复杂的SQL查查询询大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL与关系数据库的比较比较标准比较标准RDBMSNoSQL备注备注数据库原理完全支持部分支持RDBMS有关系代数理论作为基础NoSQL没有统一的理论基础数据规模大超大RDBMS很难实现横向扩展,纵向扩展的空间也比较有限,性能会随着数据规模的增大而降低NoSQL可以很容易通过添加更多设备来支持更大规模的数据数据库模式固定灵活RDBMS需要定义
4、数据库模式,严格遵守数据定义和相关约束条件NoSQL不存在数据库模式,可以自由灵活定义并存储各种不同类型的数据查询效率快可以实现高效的简单查询,但是不具备高度结构化查询等特性,复杂查询的性能不尽人意RDBMS借助于索引机制可以实现快速查询(包括记录查询和范围查询)NoSQL没有索引,虽然NoSQL可以使用MapReduce来加速查询,但是,在复杂查询方面的性能仍然不如RDBMS表5-1 NoSQL和关系数据库的简单比较 大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL与关系数据库的比较比较标准比较标准RDBMSNoSQL备注备注一致性强一致性弱一致性RDBMS严格遵守事务
5、ACID模型,可以保证事务强一致性NoSQL放松对事务ACID四性的要求,而是遵守BASE模型,只能保证最终一致性数据完整性容易实现很难实现任何一个RDBMS都可以很容易实现数据完整性,比如通过主键或者非空约束来实现实体完整性,通过主键、外键来实现参照完整性,通过约束或者触发器来实现用户自定义完整性但是,在NoSQL数据库却无法实现扩展性一般好RDBMS很难实现横向扩展,纵向扩展的空间也比较有限NoSQL在设计之初就充分考虑了横向扩展的需求,可以很容易通过添加廉价设备实现扩展可用性好很好RDBMS在任何时候都以保证数据一致性为优先目标,其次才是优化系统性能,随着数据规模的增大,RDBMS为了保
6、证严格的一致性,只能提供相对较弱的可用性NoSQL任何时候都能提供较高的可用性表5-1 NoSQL和关系数据库的简单比较(续)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL与关系数据库的比较比较标准比较标准RDBMSNoSQL备注备注标准化是否RDBMS已经标准化(SQL)NoSQL还没有行业标准,不同的NoSQL数据库都有自己的查询语言,很难规范应用程序接口技术支持高低RDBMS经过几十年的发展,已经非常成熟,Oracle等大型厂商都可以提供很好的技术支持NoSQL在技术支持方面仍然处于起步阶段,还不成熟,缺乏有力的技术支持可维护性复杂复杂RDBMS需要专门的数据库管
7、理员(DBA)维护NoSQL数据库虽然没有DBMS复杂,也难以维护表5-1 NoSQL和关系数据库的简单比较(续)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4 NoSQL的四大类型 NoSQL数据库虽然数量众多,但是,归结起来,典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4 NoSQL的四大类型 NoSQL数据库虽然数量众多,但是,归结起来,典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4.1 键值数据库相关
8、产品相关产品Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached数据模型数据模型键/值对典型应用典型应用内容缓存,比如会话、配置文件、参数、购物车等优点优点扩展性好,灵活性好,大量写操作时性能高缺点缺点无法存储结构化信息,条件查询效率较低使用者使用者百度云数据库(Redis)、GitHub(Riak)、BestBuy(Riak)、Twitter(Redis和Memcached)、StackOverFlow(Redis)、Instagram(Redis)、Youtube(Memcached)、Wikipedia(Memcached)大数据技术原理与应用
9、 厦门大学计算机科学系 林子雨 5.4.2 列族数据库相关产品相关产品BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS数据模型数据模型列族典型应用典型应用分布式数据存储与管理优点优点查找速度快,可扩展性强,容易进行分布式扩展,复杂性低缺点缺点功能较少,大都不支持强事务一致性使用者使用者Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Twitter(Cassandra and HBase)、Facebook(HBase)、Yahoo!(HBase)大数据技术原理与应用 厦门大学计算机科学系
10、 林子雨 5.4.3 文档数据库相关产品相关产品CouchDB、MongoDB、Terrastore、ThruDB、RavenDB、SisoDB、RaptorDB、CloudKit、Perservere、Jackrabbit数据模型数据模型版本化的文档典型应用典型应用存储、索引并管理面向文档的数据或者类似的半结构化数据优点优点性能好,灵活性高,复杂性低,数据结构灵活缺点缺点缺乏统一的查询语法使用者使用者百度云数据库(MongoDB)、SAP(MongoDB)、Codecademy(MongoDB)、Foursquare(MongoDB)、NBC News(RavenDB)大数据技术原理与应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Chapter 厦门大学 林子 数据 技术 原理 应用 第五
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。