Google云计算原理分布式锁服务.pptx
《Google云计算原理分布式锁服务.pptx》由会员分享,可在线阅读,更多相关《Google云计算原理分布式锁服务.pptx(53页珍藏版)》请在咨信网上搜索。
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/12/5,#,主要内容(,6,学时),概念回顾,Google,云计算背景,分布式文件系统,GFS,并行数据处理模型,MapReduce,分布式锁服务,Chubby,分布式数据库,BigTable,Google AppEngine,Google,云计算技术小结,Google,的云计算,课程回顾,2,分布式文件系统,GFS,GFS,的容错措施有哪些?,GFS,的容错方法,GFS,的容错机制,Chunk Server,容错,每个,Chunk,有多个存储副本(通常是,3,个),分别存储于不通的服务器上,每个,Chunk,又划分为若干,Block,(,64KB,),每个,Block,对应一个,32bit,的校验码,保证数据正确(若某个,Block,错误,则转移至其他,Chunk,副本),Master,容错(影子节点热备),三类元数据:命名空间(目录结构)、,Chunk,与文件名的映射以及,Chunk,副本的位置信息,前两类通过日志提供容错,,Chunk,副本信息存储于,Chunk Server,,,Master,出现故障时可恢复,4,并行数据处理模型,MapReduce,1,、处理流程,2,、分片方式,MapReduce,处理流程中,各类文件的存储位置在哪,里?,MapReduce,的容错方法?,MapReduce,的处理优化,方法?,MapReduce,仅能对,GFS,之上的文件进行处理吗?,问题讨论,所有步骤均可控,可灵活处理各类分布式问题,灵活的,MapReduce,除了排序,新增两道题目,使用,MapReduce,实现倒排索引,输入:,100,个文本文档,输出:倒排索引,任务,实现算法,给出数据结构描述、执行过程描述等,作业要求同“排序”,要求尽可能提高执行效率,节约网络,IO,带宽,云计算应用实践作业调整,除了排序,新增两道题目,使用,MapReduce,实现快速查询,查询目标是存储在,BigTable,之中的网页数据,给定关键字,快速查询含有该内容的网页(假定没有倒排索引),要求,设计,BigTable,存储方式(表含有哪些列、无需关心数据如何取得),设计快速查询的,MapReduce,处理方法,作业要求同“排序”,云计算应用实践作业调整,Google,的云计算,分布式锁服务,Chubby,10,主要用于解决分布式一致性问题,在一个分布式系统中,有一组的,Process,,它们需要确定一个,Value,。于是每个,Process,都提出了一个,Value,,一致性就是指只有其中的一个,Value,能够被选中作为最后确定的值,并且当这个值被选出来以后,所有的,Process,都需要被通知到,粗粒度的分布式锁服务,Chubby,是,Google,为解决分布式一致性问题而设计的提供粗粒度锁服务的,文件系统,其他分布式系统可以使用它对共享资源的访问进行同步,Chubby,是什么?,11,需要实现的特性,高可用性,高可靠性,支持粗粒度的建议性锁服务,支持小规模文件直接存储,不作考虑的特性,高性能,存储能力,Chubby,的设计目标,12,Chubby,的系统架构,13,文件系统中文件的权限,文件系统中文件操作的权限有哪些?,这些权限之间的互斥关系是怎样的?,Chubby,系统本质上就是一个分布式的、存储大量小文件的文件系统,Chubby,中的锁就是文件,在,GFS,的例子中,创建文件就是进行“加锁”操作,创建文件成功的那个,server,其实就是抢占到了“锁”,用户通过打开、关闭和存取文件,获取共享锁或者独占锁;并且通过通信机制,向用户发送更新信息,Chubby,文件系统,15,Client,与,Chubby,的通信协议,16,主节点选举,独占锁,共享锁,数据存取应用,获取,GFS ChunkServer,信息,元数据存储,Chubby,的应用,17,Goolge,的云计算,分布式数据表,BigTable,18,BigTable,为什么需要设计,BigTable,?,Google,需要存储的数据种类繁多,网页,地图数据,邮件,如何使用统一的方式存储各类数据?,海量的服务请求,如何快速地从海量信息中寻找需要的数据?,BigTable,:基于,GFS,和,Chubby,的分布式存储系统,对数据进行结构化存储和管理,与,GFS,的联系,19,数据存储可靠性,高速数据检索与读取,存储海量的记录(若干,TB,),可以保存记录的多个版本,Google,的需求,20,与写操作相比,数据记录读操作占绝大多数工作负载,单个节点故障损坏是常见的,磁盘是廉价的,可以不提供标准接口,Google,既能控制数据库设计,又能进行应用系统设计,假设,21,具有广泛的适应性,支持,Google,系列产品的存储需求,具有很强的可扩展性,根据需要随时加入或撤销服务器,应对不断增多的访问请求,高可用性,单个节点易损,但要确保几乎所有的情况下系统都可用,简单性,简单的底层系统可减少系统出错概率,为上层开发带来便利,设计目标,22,总体上,与关系数据库中的表类似,逻辑视图,Row Key,Time Stamp,Column Contents,Column Anchor,Column“mime”,my.look.ca,“n.www”,T9,CNN,T8,CNN.COM,T6,“.“,Text/html,T5,“.“,t3,“.“,23,关系数据库中的表是什么样的?有什么特征?,关系数据库中的表设计需要遵循什么原则?,行,每行数据有一个可排序的关键字和任意列项,字符串、整数、二进制串甚至可串行化的结构都可以作为行键,表按照行键的“逐字节排序”顺序对行进行有序化处理,表内数据非常稀疏,不同的行的列的数完全目可以大不相同,URL,是较为常见的行键,存储时需要倒排,统一地址域的网页连续存储,便于查找、分析和压缩,数据模型,/index.asp,com.baidu.mp3,/index.asp,24,列,特定含义的数据的集合,如图片、链接等,可将多个列归并为一组,称为族(,family,),采用,族,:,限定词,的语法规则进行定义,fileattr:owning_group”,“fileattr:owning_user”,etc,同一个族的数据被压缩在一起保存,族是必须的,是,BigTable,中访问控制的基本单元,数据模型,25,时间戳,保存不同时期的数据,如“网页快照”,“A big table”,表中的列可以不受限制地增长,表中的数据几乎可以无限地增加,数据模型,通过,(row,col,timestamp),查询,通过,(row,col,MOST_RECENT),查询,26,无数据校验,每行都可存储任意数目的列,BigTable,不对列的最少数目进行约束,任意类型的数据均可存储,BigTable,将所有数据均看作为字符串,数据的有效性校验由构建于其上的应用系统完成,一致性,针对同一行的多个操作可以分组合并,不支持对多行进行修改的操作符,数据模型,27,物理视图,Row Key,Time Stamp,Column:Contents,Cn.www,T6,“.”,T5,“.”,T3,“.”,Row Key,Time Stamp,Column:Anchor,Cn.www,T9,Anchor:,CNN,T5,Anchor:my.look.ca,CNN.COM,Row Key,Time Stamp,Column:,mime,Cn.www,T6,text/html,Row Key,Time Stamp,Column Contents,Column Anchor,Column“mime”,my.look.ca,“n.www”,T9,CNN,T8,CNN.COM,T6,“.“,Text/html,T5,“.“,t3,“.“,28,逻辑上的“表”被划分为若干子表(,Tablet,),每个,Tablet,由多个,SSTable,文件组成,SSTable,文件存储在,GFS,之上,每个子表存储了,table,的一部分行,元数据:起始行键、终止行键,如果子表体积超过了阈值(如,200M,),则进行分割,物理视图,29,体系结构,30,为每个子表服务器分配子表,对外提供服务,与,GFS,垃圾回收进行交互,收回废弃的,SSTable,探测子表服务器的故障与恢复,负载均衡,主节点的职责,有效缓解单点故障,31,子表服务器故障,32,子表服务器故障,33,子表服务器故障,34,数据访问方式,35,任何对子表的写操作都会记录到一个存储在,GFS,之上的,commit log,中,每个子表服务器上所有子表变化对应于一个,commit log,新的数据存储到子表服务器的内存(,memtable,)中,次压缩,旧数据存储在,SSTable,中,而新数据存放在,memtable,中,当,memtable,体积超过一定阈值,将形成,SSTable,,并写入,GFS,每个,tablet,对应多个,SSTable,数据写的流程,36,tablet,含有多个,SSTable,导致查询效率低,合并压缩操作读取多个,SSTable,,创建一个新的,SSTable,来保持其中的最新数据,旧的,SSTable,删除,如果合并压缩操作完成后,,tablet,只包含一个,SSTable,,那么该操作也称为主压缩,合并压缩,37,数据存储与读取流程,38,新的故障,子表服务器内存中的,memtable,丢失,恢复方法,按照,tablet,将该服务器对应的日志分片,为每个失效,tablet,分配新的子表服务器,新子表服务器读取对应的分段,commit log,,并按照日志修改,tablet,删除,commit,log,中已实施的内容,重新对外提供服务,子表服务器故障恢复,39,局部性群组,(Locality Group),根据需要,将原本不存储在一起的数据,以列族为单位存储至单独的子表,如用户对网站排名、语言等分析信息感兴趣,那么可以将这些列族放至单独的子表,减少无用信息读取,改善存取效率,布隆过滤器,(Bloom Filter),什么是布隆过滤器?判断某个元素是否隶属于集合,优点:误判概率低,其存储空间仅为,Hash,表的,1/8,至,1/4,用于判断列键是否位于,SSTable,中,快速确定某个列键的位置,性能优化,40,BigTable,小结,41,Google,云计算架构中,GFS,、,MapReduce,和,BigTable,中是否存在集群节点复用的情况?,如何复用?,节点复用的好处有哪些?,Google,云计算架构的设计对你有哪些启发?有哪些收获?,综合讨论,Goolge,的云计算,Google App Engine,43,Google,App,Engine,是隶属于,PaaS,类型的云服务,一个计算环境,支持,Python,和,Java,语言,可使用,Google,的基础服务,如,BigTable,和,GFS,等,用户仅需提供应用代码,无需服务器维护,应用程序可根据访问量和数据存储需要的增长轻松进行扩展,简介,44,特性,动态网络服务功能,能够完全支持常用的网络技术,具有持久存储的空间,可支持查询、分类等基本操作,具有自主平衡网络和系统的负载、自动进行扩展的功能,可对用户的身份进行验证,并且支持使用,Google,账户发送邮件,具有一个功能完整的本地开发环境,开发人员可以在自身的计算机上模拟,Google App Engine,环境,应用程序环境,45,沙盒,一个虚拟环境,将开发者开发的应用程序隔离在自身的安全可靠的环境中,该环境和网络服务器的硬件、系统以及物理位置完全无关,仅提供开发人员对基础操作系统的有限访问权限,可以对开发人员进行更多的限制,只能通过网址抓取,API,和邮件服务,API,访问其他计算机,其他计算机只能通过,HTTP,或,HTTPS,与沙盒应用交互,应用程序无法对平台文件系统进行写入操作,只能读取代码文件,应用程序必须使用平台的,Data Store,来存储应用程序运行期间持续存在的数据,应用程序环境,通过隔离来保证平台和其他开发者的安全,46,图像操作,API,开发人员可通过该,API,对,JPEG,和,PNG,图像进行缩放、裁剪、旋转和翻转等操作,邮件,API,为开发人员开发的应用程序提供电子邮件发送服务,Memcache API,高性能的内存键值缓存,用户可使用应用程序访问该缓存,可提高应用程序的性能并减少数据库的负载,网址抓取,API,可以使用,HTTP,或,HTTPS,等网址来对数据进行检索,平台服务,47,用户,API,使应用程序与,Google,帐号集成,支持,Google,帐号身份认证,数据库,API,为用户提供查询引擎和事务存储服务,平台服务,48,Hello World,print Content-Type:text/plain,print,print Hello,world!,49,Goolge,的云计算,Google,云计算小结,50,Google,云计算小结,Google,云计算应用,MapReduce,BigTable,GFS,Chubby,单机,PC,磁盘存储,进程管理,锁管理,数据库,Google,云平台,GFS,MapReduce,Chubby,BigTable,Google,云计算小结,Google,云计算应用类型,52,欢迎访问,中国云计算网站,欢迎使用,云计算教材 电子工业出版社 刘鹏 主编,本讲到此结束,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Google 计算 原理 分布式 服务
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文