第4章-流水技术与向量处理.pptx
《第4章-流水技术与向量处理.pptx》由会员分享,可在线阅读,更多相关《第4章-流水技术与向量处理.pptx(188页珍藏版)》请在咨信网上搜索。
1、2024/4/24周三1第第4 4章章 流水技术与向量处理流水技术与向量处理 4.1 标量流水工作原理标量流水工作原理4.2 标量流水中的障碍及控制标量流水中的障碍及控制 4.3 流水线的调度技术流水线的调度技术4.4 先进的流水技术先进的流水技术4.5 Pentium微微处处理理器器中中的的流流水水技技术术4.6 向量流水技术向量流水技术2024/4/24周三2本章学习要求掌握标量流水的性能分析及障碍的处理方法掌握非线性流水调度技术掌握向量流水机的结构特征、向量指令并行性分析了解标量流水、超标量流水、超流水及超长指令字计算机的基本工作原理2024/4/24周三3提高指令执行速度的主要途径:提
2、高指令执行速度的主要途径:(1)(1)提高处理机的工作主频提高处理机的工作主频(2)(2)采用更好的算法和设计更好的功能采用更好的算法和设计更好的功能部件部件(3)(3)采用指令级并行技术采用指令级并行技术三种指令级并行处理机:三种指令级并行处理机:(1)(1)流水线处理机和超流水线流水线处理机和超流水线(Super-(Super-pipelining)pipelining)处理机处理机(2)(2)超标量超标量(Superscalar)(Superscalar)处理机处理机(3)(3)超长指令字超长指令字(VLIW:Very Long(VLIW:Very Long Instruction Wo
3、rd)Instruction Word)处理机处理机2024/4/24周三44.1 标量流水工作原理标量流水工作原理什么是流水线?什么是流水线?考虑设计一个洗衣机的工作流程,假定它有三道考虑设计一个洗衣机的工作流程,假定它有三道工序:洗涤、清洗、甩干。每个环节为工序:洗涤、清洗、甩干。每个环节为5 5分钟分钟。需要完成的任务为需要完成的任务为3 3批,则考虑下述工作方式的工批,则考虑下述工作方式的工作效率作效率:第一种:串行工作方式,即按照如下方式工作:第一种:串行工作方式,即按照如下方式工作:第第1批批洗涤洗涤第第1批批清洗清洗第第1批批甩干甩干第第2批批洗涤洗涤第第2批批清洗清洗第第2批批
4、甩干甩干第第3批批洗涤洗涤第第3批批清洗清洗第第3批批甩干甩干3批衣服的整个工作时间为批衣服的整个工作时间为3*3*5=45分钟分钟2024/4/24周三5第二种:重叠工作方式,设计三个部件,可以同时第二种:重叠工作方式,设计三个部件,可以同时工作,每个部件只做一样工作,操作方式如下图:工作,每个部件只做一样工作,操作方式如下图:第第1批洗涤批洗涤第第1批清洗批清洗第第1批甩干批甩干第第2批洗涤批洗涤 第第2批清洗批清洗第第2批甩干批甩干第第3批洗涤批洗涤第第3批清洗批清洗第第3批甩干批甩干Tttttt3 3批衣服的工作时间为批衣服的工作时间为5*5=255*5=25分钟,节省分钟,节省202
5、0分钟。分钟。2024/4/24周三6引出下述关于洗衣机工作的有关性能特点:引出下述关于洗衣机工作的有关性能特点:吞吐率:单位时间内完成的任务数吞吐率:单位时间内完成的任务数TP=n/TTP=n/T 加速比:串行方式与流水线方式的时间比:上述为加速比:串行方式与流水线方式的时间比:上述为 45/25=1.845/25=1.8 效率:即洗衣机的利用率,上述洗衣机的效率是效率:即洗衣机的利用率,上述洗衣机的效率是9/15=3/5=60%9/15=3/5=60%将一条指令的执行分为几个阶段,让几条指令按重将一条指令的执行分为几个阶段,让几条指令按重叠或流水方式工作,以提高程序的执行速度。这就叠或流水
6、方式工作,以提高程序的执行速度。这就引出了计算机中的流水线技术。引出了计算机中的流水线技术。2024/4/24周三7指令的重叠解释与先行控制计算机系统中广泛存在着重叠工作方式指令的解释方式一般只有三种:顺序、重叠和流水重叠和流水给指令的执行带来了高的吞吐率和加速比,同时也给系统增加了障碍2024/4/24周三8指令的解释过程指令的解释过程ALULOAD/STOREIF取指取指取指取指ID译码、读寄存器堆译码、读寄存器堆译码、读寄存器堆译码、读寄存器堆EX执行执行计算访存有效地址计算访存有效地址MEM-访存(读或写)访存(读或写)WB结果写回寄存器堆结果写回寄存器堆将读出的数据写入寄存器堆将读出
7、的数据写入寄存器堆2024/4/24周三9一、指令的重叠解释方式一、指令的重叠解释方式1 1、顺序执行方式、顺序执行方式 一条指令的执行过程:一条指令的执行过程:取指令取指令-分析分析-执行执行执行执行n n条指令所用的时间为:条指令所用的时间为:如每段时间都为如每段时间都为t t,则执行,则执行n n条指令所用的时间为:条指令所用的时间为:T=3ntT=3nt主要优点:主要优点:控制简单,节省设备。控制简单,节省设备。主要缺点:主要缺点:执行指令的速度慢,功能部件的利用率很低。执行指令的速度慢,功能部件的利用率很低。取指令k 分析k 执行k 取指令k+1 分析k+1执行k+12024/4/2
8、4周三10 2 2、重叠执行方式、重叠执行方式(最简单的流水线方式最简单的流水线方式)如果每个过程的时间相等,则执行如果每个过程的时间相等,则执行n n条指令的条指令的时间为:时间为:T=(1+2n)tT=(1+2n)t 主要优点:主要优点:指令的执行时间缩短指令的执行时间缩短 功能部件的利用率明显提高功能部件的利用率明显提高 主要缺点:主要缺点:需要增加一个需要增加一个IBRIBR取指 分析 执行取指 分析 执行取指 分析 执行2024/4/24周三113、更高重叠度的重叠解释方式、更高重叠度的重叠解释方式把取第把取第k+1条指令提前到分析第条指令提前到分析第k条指令同时执行条指令同时执行如
9、果三个过程的时间相等,执行如果三个过程的时间相等,执行n n条指令的时间条指令的时间为:为:T=(2+n)tT=(2+n)t理想情况下同时有三条指令在执行理想情况下同时有三条指令在执行处理机的结构要作比较大的改变,必须采用先行处理机的结构要作比较大的改变,必须采用先行控制方式控制方式取指k+2 分析k+2 执行k+2取指k+1 分析k+1 执行k+1取指k分析k执行k2024/4/24周三121访存冲突访存冲突 分析与取指均要访问主存分析与取指均要访问主存 解决:解决:1)采用两个独立编制的存贮器)采用两个独立编制的存贮器 数据数据/指令指令 但增加了复杂性但增加了复杂性 2)采用多体交叉存贮
10、器)采用多体交叉存贮器 3)指令缓冲寄存器指令缓冲寄存器2功能部件的冲突功能部件的冲突 解决:解决:设置独立的分析部件和执行部件设置独立的分析部件和执行部件 重叠方式对计算机组成的要求重叠方式对计算机组成的要求2024/4/24周三133同步同步 分析与执行所需的时间不同,要求的是一次分析与执行所需的时间不同,要求的是一次重叠重叠 一一次次重重叠叠:任任何何时时间间都都是是“分分析析K+1”与与“执执行行K”的重叠的重叠 =相邻两条指令的重叠相邻两条指令的重叠分析分析K执行执行K分析分析K+1 执行执行K+1T=(n+1)t2024/4/24周三144转移转移 无无条条件件转转移移/条条件件转
11、转移移当当转转移移成成功功时时,重重叠叠预预取无效,变为顺序执行取无效,变为顺序执行 应尽可能不使用或少使用条件转移指令应尽可能不使用或少使用条件转移指令5相关相关 邻邻近近指指令令之之间间出出现现某某种种关关联联,为为避避免免出出错错而而不不能能同时执行的现象。同时执行的现象。局部性相关、全局性相关局部性相关、全局性相关2024/4/24周三152024/4/24周三16先行控制技术先行控制技术基本思想:使分析和执行部件分别连续不断地运行,使部基本思想:使分析和执行部件分别连续不断地运行,使部件空闲状态减至最低。件空闲状态减至最低。(a)重叠方式分析分析k+1分析分析k执行执行k执行执行k+
12、1分析分析k+2执行执行k+2分析部件空闲执行部件空闲分析分析k+1分析分析k执行执行k分析分析k+2(b)先行控制执行执行k+1执行执行k+22024/4/24周三17关键:缓冲技术预处理技术缓冲技术:在工作速度不固定的两个功能部件之间设置缓冲栈,用以平滑它们的工作预处理技术:把进入运算器的指令都预处理成R-R型指令,与缓冲技术相结合,为进入运算器的指令准备好所需的全部操作数先行控制方式使运算器可专注于运算,从而可大幅度提高程序的执行速度 硬件要求:增设指令缓冲栈,消除取指过程;增设数据缓冲栈,保证不同指令的读、写操作并行;增设先行操作栈,保证执行部件能连续执行。2024/4/24周三18工
13、作原理主主 存存存存 控控指令分析器指令分析器先行先行指令栈指令栈先行读先行读数栈数栈后行写后行写数栈数栈执行执行部件部件先行操作栈先行操作栈数据缓冲栈数据缓冲栈 栈的深度要求:栈的深度要求:D D指缓指缓D D操作操作 D D读栈读栈 D D写栈写栈2024/4/24周三19二、标量流水工作原理二、标量流水工作原理基本思想:基本思想:流水是重叠的进一步延伸,流水是重叠的进一步延伸,使指令解释过程进一步细化,提高各部使指令解释过程进一步细化,提高各部件的利用率,以提高指令执行速度。件的利用率,以提高指令执行速度。流水线的表示方法:流水线的表示方法:连接图、时空图、连接图、时空图、预约表预约表2
14、024/4/24周三201 1、简单流水线的连接图表示、简单流水线的连接图表示 流水线的每一个阶段称为流水段、流水线流水线的每一个阶段称为流水段、流水线阶段、阶段、流水功能段流水功能段、功能段、流水级、流水、功能段、流水级、流水节拍等。一个流水阶段与另一个流水阶段相节拍等。一个流水阶段与另一个流水阶段相连形成流水线。连形成流水线。有些复杂指令,在执行阶段也采用流水线有些复杂指令,在执行阶段也采用流水线方式工作,称为操作流水线。方式工作,称为操作流水线。取指取指访存访存执行执行译码译码写回写回IFIDEXMEMWBS1S2S3S4S5输入输入输出输出2024/4/24周三21 一种指令流水线一种
15、指令流水线一般一般4 4至至1212个流水段,等于及大于个流水段,等于及大于8 8个流水段的称为超流水个流水段的称为超流水线处理机线处理机2 2、流水线的时空图、流水线的时空图采用采用“时空图时空图”表示流水线的工作过程。表示流水线的工作过程。一条简单流水线一条简单流水线的时空图的时空图:取指形成操作数地址译码取操作数执行保存结果2024/4/24周三22一个浮点加法器流水线的时空图一个浮点加法器流水线的时空图(由求阶差、对阶、由求阶差、对阶、尾数加和规格化尾数加和规格化4 4个流水段组成个流水段组成):ED1时间空间0t1t2t3t4t5ED2 ED3 ED4 ED5EA1 EA2 EA3
16、EA4 EA5MA1 MA2 MA3 MA4 MA5NL1 NL2 NL3 NL4 NL5t6t7t8NL:规格化MA:尾数加EA:对阶ED:求阶差EDEAMANLmt2024/4/24周三233、流水线的预约表时间流水段1234567S1XXXS2XXS3XXS4X2024/4/24周三24三、流水线工作方式三、流水线工作方式取指取指访存访存执行执行译码译码写回写回IFIDEXMEMWBS1S2S3S4S5输入输入输出输出指令的流水处理指令的流水处理 流流水水线线的的基基本本结结构构中中主主要要包包括括三三大大部部分分:锁锁存存器器、时时钟钟、功能段。功能段。流流水水线线中中每每个个段段都都
17、是是由由一一些些执执行行算算术术和和逻逻辑辑功功能能的的组组合合逻逻辑辑线线路路组组成成的的,它它们们可可以以互互相相独独立立地地对对流流过过的的信信息息进进行行某某种种操操作作,相相邻邻两两站站由由高高速速锁锁存存器器(latch)隔隔开开,信信息息在在各各段段间间的的流流动靠同时送到各站的时钟信号来控制。动靠同时送到各站的时钟信号来控制。1 1、流水线的结构、流水线的结构2024/4/24周三25S1S2Sm输入输入 输出输出流水线的基本结构流水线的基本结构.时钟时钟2024/4/24周三26121321nn-1.43215432.543.54.5nn-1.n-1.nn-1 n1234tt
18、0 0 t t0 0 t t0 0 t t0 0T T0=0=m m t t0 0n n t t0 0T T(m-1)t(m-1)t0 0(n-1)t(n-1)t0 0填入填入 正常正常 排空排空 流水时空图流水时空图空间空间时间时间建立时间、正常流动时间、排空时间。建立时间、正常流动时间、排空时间。2 2、流水线工作的三个时间、流水线工作的三个时间2024/4/24周三273 3、流水线的分级、分类、流水线的分级、分类分级分级:(处理的级别分类):(处理的级别分类)v 部件级部件级(操作流水线操作流水线):将复杂的算逻运算组成流水工作方式;:将复杂的算逻运算组成流水工作方式;v指令级:指令级
19、:把一条指令解释过程分成多个子过程把一条指令解释过程分成多个子过程;v处理机级:每个处理机完成某一专门任务,各个处理机所得到的处理机级:每个处理机完成某一专门任务,各个处理机所得到的结果需存放在与下一个处理机所共享的存储器中结果需存放在与下一个处理机所共享的存储器中 2024/4/24周三28其他分类:其他分类:功能:单功能流水线(如功能:单功能流水线(如CRAY-1CRAY-1)、多功能流水线(如)、多功能流水线(如TI-TI-ASCASC)工作方式:静态流水线、动态流水线工作方式:静态流水线、动态流水线 连接方式:线性、非线性连接方式:线性、非线性 处理数据:标量流水、向量流水处理数据:标
20、量流水、向量流水1234出出入入非线性流水线非线性流水线2024/4/24周三291)ASC算术运算流水线(多功能)算术运算流水线(多功能)输入输入减阶减阶对阶移位对阶移位相加相加规格化规格化相乘相乘累加累加输出输出123456784 4、流水线举例、流水线举例输入输入减阶减阶对阶移位对阶移位相加相加规格化规格化输出输出123458加加输入输入相乘相乘累加累加输出输出1678乘乘2024/4/24周三30.1234.n-1 n.1234.n-1 n.1234.n-1n.1234.n-1 n12345867.1234.n-1 n.1234.n-1 n时间时间空间空间(段号段号)加法加法一一 二二
21、 三三 四四二二 三三一一二二一一一一乘法乘法.静态多功能流水线时静态多功能流水线时-空图空图静态流水线:静态流水线:只有当进入的是一串相同运算的指令时,流水的只有当进入的是一串相同运算的指令时,流水的效能才得以发挥,才能使各个功能段并行地对多条指令的数据效能才得以发挥,才能使各个功能段并行地对多条指令的数据进行流水处理。进行流水处理。2024/4/24周三31区区别别:如如果果从从软软硬硬功功能能分分配配的的观观点点上上来来看看,静静态态流流水水线线其其实实是是把把功功能能负负担担较较多多地地加加到到软软件件上上,以以简简化化硬硬件件;动动态态流流水水线线则则是是把功能负担较多地加在硬件上,
22、以提高流水的效能。把功能负担较多地加在硬件上,以提高流水的效能。.12345.n-1 n.12345.n-1 n.12345.n-1 n.12345.n-1 n12345867.12345.n-1 n.12345.n-1 n时间时间加法加法乘法乘法一一二二三三 四四 五五 六六一一二二三三 四四 五五 六六七七一一二二三三 四四 五五一一二二三三 四四动态多功能流水线时动态多功能流水线时-空图空图m2024/4/24周三32四、标量流水线性能分析四、标量流水线性能分析衡量流水线处理机的性能主要是衡量流水线处理机的性能主要是吞吐率、加速比和效率吞吐率、加速比和效率。1吞吞吐吐率率:单单位位时时间
23、间内内能能处处理理的的指指令令条条数数或或能能输输出出的的数数据据量量。吞吞吐吐率率越越高高,计计算算机机系系统统的的处处理理能能力力就就越越强强。就就流流水水线线而而言言,吞吐率就是单位时间内能流出的任务数或能流出的结果数。吞吐率就是单位时间内能流出的任务数或能流出的结果数。最大吞吐率:流水线达到稳定状态后可获得的吞吐率。最大吞吐率:流水线达到稳定状态后可获得的吞吐率。(1)Tpmax=1/t(2)TPmax=1/max t1,t2,t3,t4 “瓶颈瓶颈”子过程:子过程:1234 t t 3 t t 2024/4/24周三33子过程子过程3为瓶颈段的时空图为瓶颈段的时空图最大吞吐率最大吞吐
24、率TPmax=1/3 t mTS1S2S3S4t1t2t3t4t5t6t7t8t9t10t12t13t14t151234t11123412341234输出输出2024/4/24周三34131232334 2 1 4 3a 3b 3c 333瓶颈段细分瓶颈段细分重复设置瓶颈流水段重复设置瓶颈流水段解决瓶颈有两种方法解决瓶颈有两种方法A:B:2024/4/24周三35T重复设置瓶颈流水段后的工作时空图重复设置瓶颈流水段后的工作时空图mS1S2S3aS3cS3bS41 2 3546 7 8 9 10 11121 2 3546 7 8 9 10 11121471025811369121 2 3546
25、7 8 9 10 11 12t1t12t172024/4/24周三36实际吞吐率实际吞吐率(1)完成)完成n条指令的解释共需时间条指令的解释共需时间 可可以以看看出出不不仅仅实实际际的的吞吞吐吐率率总总是是小小于于最最大大的的吞吞吐吐率率,而而且且只只有有当当nm时时,实实际际的的吞吞吐吐率率才才能能接接近近于于理理想想的最大吞吐率。的最大吞吐率。(2)各功能段时间不相等各功能段时间不相等2024/4/24周三372.效率:设备的利用率,直接反映了处理机结构有效程度。流水线有建立时间、排空时间,不总是满负载工作。各段时间相等:各段时间相等:各段时间不等:各段时间不等:2024/4/24周三38
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流水 技术 向量 处理
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。