并行计算4.ppt
《并行计算4.ppt》由会员分享,可在线阅读,更多相关《并行计算4.ppt(37页珍藏版)》请在咨信网上搜索。
1、并行计算并行计算结构结构算法算法编程编程主讲:雷向东中南大学 信息科学与工程学院Central South UniversitySchool of Information Science and Engineering 并行算法2 并行算法就是用多台处理机 联合求解问题的方法和步骤,其执行过程是将给定的问题首先分解成若干个尽量相互独立的子问 题,然后使用多台计算机同时求解它,从而最终求得原问题的解。并行算法是并行计算中非常重要的问题。并法研究应该确立一个“理论设计实现应用”的系统方法,形成一个完善的“架构算法编程”方法论,这样才能保证并行算法不断发展并变得更加实用。由于人们的思维能力以及思考问
2、题的方法对并行不太习惯,且并行算法理论不成熟,所以总是出现了需求再来研究算法,不具有导向性,同时实现并行算法的并行程序性能较差,往往满足不了人们的需求。并行算法的研究历史可简单归纳为:上世纪70到80年代,并行算法研究处于高潮;到上世纪90年代跌入低谷;目前,又处于研究的热点阶段。第四章并行计算模型并行算法3并行算法的研究内容:(1)并行计算模型并行算法作为一门学科,首先研究的是并行计算模型。并行计算模型是算法设计者与体系结构研究者之间的一个桥梁,是并行算法设计和分析的基础。它屏蔽了并行机之间的差异,从并行机中抽取若干个能反映计算特性的可计算或可测量的参数,并按照模型所定义的计算行为构造成本函
3、数,以此进行算法的复杂度分析。并行计算模型:第一代是共享存储模型,如SIMD-SM和MIMD-SM的一些计算模型,模型参数主要是CPU的单位计算时间,科学家可以忽略一些细节,集中精力设计算法。第二代是分布存储模型。在这个阶段,人们逐渐意识到对并行计算机性能带来影响的不仅仅是CPU,还有通信。因此如何把不同的通信性能抽象成模型参数,是这个阶段的研究重点。并行算法4并行计算模型:第三代是分布共享存储模型,也是我们目前研究所处的阶段。随着网络技术的发展,通信延迟固然还有影响,但对并行带来的影响不再像当年那样重要,注重计算系统的多层次存储特性的影响。(2)设计技术并行算法研究的第二部分是并行算法的设计
4、技术。虽然并行算法研究还不是太成熟,但并行算法的设计依然是有章可循的,例如划分法、分治法、平衡树法、倍增法/指针跳跃法、流水线法破对称法等都是常用的设计并行算法的方法。另外人们还可以根据问题的特性来选择适合的设计方法。目前并行算法研究的新走向是:并行算法研究内容不断拓宽,并行计算被纳入研究范畴;与广大用户领域结合,注重应用,强调走到用户中去,为用户解决问题;重视新的、非常规计算模式,如神经计算、量子计算等,这些模式能够解决某类特定问题,有其自身的优越性。并行算法的分类5数值并行算法:(1)数值计算(矩阵运算、求解线性方程组等)(2)非数值并行算法:符号运算(排序、匹配、收索等)(3)同步并行算
5、法:向量算法、SIMD、MIMD同步(4)异步并行算法:不需相互等待(5)独立并行算法:进程间完全独立(6)细粒度并行算法:基于向量和循环系级并行(7)中粒度并行算法:较大的循环级并行(8)大粒度并行算法:任务级并行(区域分解)6 并行算法的表达n描述语言n可以使用类Pascal等;n在描述语言中引入并行语句。n并行语句示例nPar-do语句 for i=1 to n par-do end fornfor all语句 for all Pi,where 0ik end for 7 并行算法的复杂性度量n串行算法的复杂性度量n最坏情况下的复杂度(Worst-CASE Complexity)n期望复
6、杂度(Expected Complexity)n并行算法的几个复杂性度量指标n运行时间t(n):包含计算时间和通讯时间,分别用计算时间步和选路时间步作单位。n为问题实例的输入规模。n处理器数p(n)n并行算法成本c(n):c(n)=t(n)p(n)n总运算量W(n):并行算法求解问题时所完成的总的操作步数。8第四章并行算法的复杂性度量nBrent定理令W(n)是某并行算法A在运行时间T(n)内所执行的运算量,则A使用p台处理器可在t(n)=O(W(n)/p+T(n)时间内执行完毕。nW(n)和c(n)密切相关nP=O(W(n)/T(n)时,W(n)和c(n)两者是渐进一致的n对于任意的p,c(
7、n)W(n)9 并行算法的同步同步是在时间上强使各执行进程在某一点必须互相等待;共享存储多处理器上求和算法,处理器数pBegin S=0;for all Pi where 0ip-1 do L=0;for j=i to n step p do L=L+aj end for end for lock(S)S=S+L unlock(S)end for End10 PRAM模型Control UnitInterconnection NetworkPLMPLMPLMPLMShared Memory由Fortune和Wyllie1978年提出,又称SIMD-SM模型。有一个集中的共享存储器和一个指令控制
8、器,通过SM的R/W交换数据,隐式同步计算。结构图11 PRAM模型n分类(1)PRAM-CRCW并发读并发写nCPRAM-CRCW(Common PRAM-CRCW):仅允许写入相同数据nPPRAM-CRCW(Priority PRAM-CRCW):仅允许优先级最高的处理器写入nAPRAM-CRCW(Arbitrary PRAM-CRCW):允许任意处理器自由写入(2)PRAM-CREW并发读互斥写(3)PRAM-EREW互斥读互斥写 n计算能力比较nPRAM-EREW是功能最弱的计算模型,而PRAM-CRCW则是最强的计算模型12 PRAM模型nPRAM模型优点:PRAM模型特别适合于并行
9、算法的表达、分析和比较,使用简单,很多关于并行计算机的底层细节,比如处理器间通信、存储系统管理和进程同步都被隐含在模型中;易于设计算法和稍加修改便可以运行在不同的并行计算机系统上;根据需要,可以在PRAM模型中加入一些诸如同步和通信等需要考虑的内容。13 PRAM模型nPRAM模型的缺点:(1)模型中使用了一个全局共享存储器,且局存容量较小,不足以描述分布主存多处理机的性能瓶颈,而且共享单一存储器的假定,显然不适合于分布存储结构的MIMD机器;(2)PRAM模型是同步的,这就意味着所有的指令都按照锁步的方式操作,用户虽然感觉不到同步的存在,但同步的存在的确很耗费时间,而且不能反映现实中很多系统
10、的异步性;(3)PRAM模型假设了每个处理器可在单位时间访问共享存储器的任一单元,因此要求处理机间通信无延迟、无限带宽和无开销,假定每个处理器均可以在单位时间内访问任何存储单元而略去了实际存在的,合理的细节,比如资源竞争和有限带宽,这是不现实的;14 PRAM模型nPRAM模型的缺点:(4)PRAM模型假设处理机有限或无限,对并行任务的增大无开销;(5)未能描述所线程技术和流水线预取技术,而这两种技术又是当今并行体系结构用的最普遍的技术。APRAM模型15 APRAM(Asynchronous Parallel Random Access Machine)指的是异步随机存取并行机器模型,显然,
11、APRAM是一种MIMD模型。在有的文献上,APRAM也称作Phased PRAM(分相PRAM)。它由p个处理器组成,特点是每个处理器都有自己的局部存储器、局部时钟和局部程序,处理器之间的通信通过全局共享存储器进行。每个全局时钟,所以各处理器异步的独立执行各自的程序,处理器之间任何时间上的依赖关系(执行次序)需要明确的在各处理器的程序中加入同步障碍语句(Synchronization Barrier)来实现,一条指令可以在非确定(无界)但有限的时间内完成。APRAM模型16APRAM模型特点:APRAM模型最重要的特点是处理器均工作在异步模式下,即处理器有自己的控制器,局部存储器以及局部程序
12、。处理器间的同步问题通过添加同步路障(Synchronization Barrier)来解决。这样,计算被分割成一些列的相(Phase),每一相类不允许两个处理器去访问同一存储单元。而局部程序的最后一条指令一定是同步指令。显然,同步路障的时间是由最后一个到达的处理器决定的,也就是说,先执行完局部程序的处理器必须等到执行的最慢的那个处理器来一起完成同步路障。17APRAM模型APRAM中的指令有四种类型:(1)全局读,将全局存储单元中的内容读到处理器得局部存储单元中;(2)局部操作,对局部存储器中的数据执行局部操作,操作的结果存放到局部存储器中;(3)全局写,将局部存储器单元中的内容写入全局存储
13、单元中;(4)同步,同步是计算中的一个逻辑点,在该点各处理器均需要等待其他的处理器也到达该点后才能继续执行它们的局部程序。18 APRAM模型APRAM模型中的计算过程:APRAM模型中,计算由一系列用同步障碍语句分开的全局相(Global Phase)所组成。如下面的图。在全局相内,每个处理器异步的运行其局部的程序;每个局部程序中的最后一条指令是一条同步障碍指令,各处理器均可以异步的读取和写入全局存储器,但在同一个全局相中,不允许两个处理器访问同一单元。正是因为不同的处理器访问存储单元总是由同步障碍指令所分开,所以指令完成时间上的差异并不影响整个计算。19 APRAM模型APRAM模型计算过
14、程20 APRAM模型n计算时间 令 为全局相内各处理器执行时间最长者,则APRAM上的计算时间为 n优缺点 易编程和分析算法的复杂度,但与现实相差较远,其上并行算法非常有限,也不适合MIMD-DM模型。BSP模型21 整体同步并行计算模型(Bulk Synchronous Parallel Computing Model,简称BSP模型),又名大同步模型或BSP模型,由哈佛大学Viliant和牛津大学Bill McColl提出,其目的是像冯诺伊曼体系结构那样,为各种并行体系结构提供一个独立于具体体系结构的、具有可扩展并行性的理论模型,成为一个并行计算领域中软件和硬件之问的桥梁BSP模型不仅是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 计算
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。