高等计算机标准体系结构.doc
《高等计算机标准体系结构.doc》由会员分享,可在线阅读,更多相关《高等计算机标准体系结构.doc(28页珍藏版)》请在咨信网上搜索。
1、第一章计算机体系结构基础概念1八十年代后,有两种技术使得体系结构技术对计算机性能发展影响越来越大: 1)RISC技术- 使得体系结构发展空间一下子被打开;2)微处理器技术-使得设计新型体系结构风险、成本、耗时全部大为降低。 2从计算机语言角度,把计算机系统按功效划分成多级层次结构。微程序机器级, 机器语言, 操作系统虚拟机, 汇编语言虚拟机,高级语言虚拟机,应用语言虚拟机3语言实现两种基础技术 翻译:先把N+1级程序全部变换成N级程序后,再去实施新产生N级程序,在实施过程中N+1级程序不再被访问。解释:每当一条N+1级指令被译码后,就直接去实施一串等效N级指令,然后再去取下一条N+1级指令,依
2、此反复进行。解释实施比翻译花时间多,但存放空间占用较少。4计算机体系结构定义:程序员所看到计算机属性,即概念性结构和功效特征。5透明性:在计算机技术中,对这种原来是存在事物或属性但从某种角度看又好象不存在。6。对于通用寄存器型机器,这些属性关键是指:(1) 数据表示(硬件能直接辩认和处理数据类型)(2) 寻址规则(包含最小寻址单元、寻址方法及其表示) (3) 寄存器定义(包含多种寄存器定义、数量和使用方法)(4) 指令集(包含机器指令操作类型和格式、指令间排序和控制机构等)(5) 中止系统(中止类型和中止响应硬件功效等)(6) 机器工作状态定义和切换(如管态和目态等)(7) 存放系统(主存容量
3、、程序员可用最大存放容量等)(8) 信息保护(包含信息保护方法和硬件对信息保护支持)(9) I/O结构(包含I/O连接方法、处理机/存放器和I/O设备间数据传送方法和格式和I/O操作状态等)7.经典计算机体系结构概念实质:计算机系统中软硬件界面确实定,其界面之上是软件 功效,界面之下是硬件和固件功效8.计算机组成:计算机体系结构逻辑实现。计算机组成包含内容能够有:处理机、主存等部件逻辑结构,机器级内数据流和控制流组成、各部件功效和之间联络等。计算机实现:计算机组成物理实现。计算机实现包含内容能够有:处理机、主存等部件物理结构,包含器件集成度和速度确实定,器件、模块、插件、底板划分和连接,组装装
4、配技术及信号连接、电源、冷却方法等。一个体系结构能够有多个组成。一个组成能够有多个物理实现。9.系列机:在一个厂家内生产含有相同体系结构,但含有不一样组成和实现一系列不一样型号机器。10.软件兼容:同一个软件能够不加修改地运行于体系结构相同各档机器,而且它们所取得结果一样,差异只在于有不一样运行时间。向上(下)兼容:按某档机器编制程序,不加修改就能运行于比它高(低)档机器。向前(后)兼容:按某个时期投入市场某种型号机器编制程序,不加修改地就能运行于在它之前(后)投入市场机器。向后兼容是软件兼容根本特征,也是系列机根本特征兼容机不一样厂家生产含有相同体系结构计算机。11存放程序计算机关键特点(1
5、) 机器以运算器为中心;(2) 采取存放程序原理;(3)存放器是按地址访问线性编址空间;(4) 控制流由指令流产生;(5) 指令由操作码和地址码组成; (6)数据以二进制编码表示采取二进制运算。 11.保护存放器空间是否把指令和数据放在同一存放器中?优点 :(1)无须预先区分指令和数据,易实现存放管理软件;(2)程序和指令在实施过程中能够被修改,所以能够编写出灵活可修改程序;(3)对于存取指令和数据仅需一套读/写和寻址电路,硬件简单;(4)数据能够分配于任何可用空间,从而可更有效地利用存放空间等。缺点:(1)不利于进行程序调试诊疗; (2)不利于实现程序可再入性和程序递归调用(3不利于重合和流
6、水方法操作。12.计算机能够依据价格分为五个档次: 巨型机、大型机、中型机、小型机、微型机13.依据目前计算机应用市场现实状况和价格特征,通常把计算机分为:服务器、桌面系统和嵌入式计算三大领域。14. 新型体系结构设计(1)合理地增加计算机系统中硬件功效百分比,这种体系结构对操作系统、高级语言甚至应用软件提供更多愈加好支持;(2) 经过多个路径提升计算机体系结构中并行性等级,使得通常能并行计算和处理问题全部能并行计算和处理,使这种体系结构和组成对算法提供更多愈加好支持15. 计算机设计受两方面原因影响(1)计算机现在和未来使用方法(2)下层实现技术16.软件技术最关键发展趋势程序及数据所使用存
7、放器容量不停增大;(2) 编译器关键性日益突出,逐步成为用户和计算机关键界面。17桌面计算、服务器和嵌入式计算对计算机系统设计巨大影响:(1)桌面计算市场是销售额最大市场,是对性能价格比要求最为苛刻和敏感市场。(2)服务器市场对计算机要求是可用性、大容量和可扩展性。(3)嵌入式计算和处理应用问题亲密相关,需求千差万别。18.现代计算机实现技术基础关键是以晶体管为基础单元平面集成电路。摩尔定律集成电路密度大约每两年翻一番。19四种实现技术对于现代计算机发展发挥着很关键作用逻辑电路 ,半导体DRAM(动态随机访问存放器) ,磁盘 ,网络 20.集成电路制造中关键技术指标之一:特征尺寸伴随特征尺寸减
8、小,挑战首先是功耗。原因:(1) 造成集成电路连线相对长度增加,单位长度阻抗也增大,更高电路工作主频需要更大电流来驱动电平翻转和信号改变传输;(2) 电路密度增加,造成芯片单位面积功率(功率密度)上升;(3) 集成电路在减小特征尺寸同时,也在降低电路各层厚度从而降低了工作电压;(4) 伴随特征尺寸下降,晶体管各个电极之间绝缘层性能急剧下降,电极之间漏电流问题日益突出;(5) 因为现代微处理器中部件成千上万,而这些部件并不全部是同时工作,这就需要在设计中合理分配电力使用,对于不工作部件临时减低工作性能或暂停工作,以降低系统功耗。在设计上将面临问题:微处理器芯片正确性验证复杂性成倍上升。一个计算机
9、体系结构,从产生到消亡,大致 需要1520年时间21. 影响计算机系统成本关键原因(1) 时间(对成本产生最直接影响)即使实现技术没有变动,计算机系统制造成本也会不停下降。 (2) 产量产量增加会加速工艺稳定; 产量增加提升了生产效率,降低了成本;产量增加降低每台单机必需加入开发费用,从而使得单机成本下降。 (3) 商品化(更关键是它影响产品价格)22.集成电路基础制造工艺:(1)首先生产圆片;(2)在圆片上制造出部分小程序;大量电路单元;(3)园片经过测试后根据制造电路单元被切割成基片;(4) 基片在外壳中封装好以后就是集成电路成品。集成电路成本 = 基片成本 = 每块园片上基片数 = -基
10、片成品率= 园片成品率 (1+ )-a 23.计算机性能评测 响应时间:从事件开始到结束之间时间,也称为实施时间。(计算机完成某一任务所花费全部时间) 流量:在单位时间内所能完成工作量。 相同点:全部认为能够以最短时间完成指定任务计算机就是最快。不一样点:响应时间针对单任务,而流量针对多任务。 X比Y快n倍: = nn = = =24.CPU时间CPU工作时间,不包含I/O等候时间及运行其它程序时间。用户CPU时间,系统CPU时间25.现在常见测试程序能够分为5类:(按测试可靠性由高至低次序列出) (1) 真实程序:真实使用程序;(2)修正应用程序(3) 关键程序:从真实程序中提取能反应系统性
11、能关键程序段组成程序(4) 小测试程序:特地编写反应系统某首先性能;(5) 合成测试程序:依据对大量应用程序中多种操作百分比进行统计后根据这个百分比人为制造出来程序。26。测试程序组件,选择一组各个方面有代表性测试程序,组成一个通用测试程序集合。最大优点:避免了独立测试程序存在片面性,尽可能全方面地测试了一个计算机系统性能。最常见测试程序组件是基于UNIXSPEC关键版本包含SPEC89、SPEC92 SPEC95和SPEC等。、 27. 性能设计和评测基础标准 三条基础标准和方法:(1)大约率事件优先标准对于大约率事件(最常见事件),给予它优先处理权和资源使用权,以取得全局最优结果。(2)A
12、mdahl定律加紧某部件实施速度所取得系统性能加速比,受限于该部件在系统中所占关键性。 (3) 一个“好”计算机系统:含有高性价比计算机系统是一个带宽平衡系统,而不是看它使用一些部件性能 。(1)系统加速比 = = 系统加速比依靠于两个原因: 可改善百分比:可改善部分在原系统计算时间中所占百分比,它总是小于等于。比如: 一个需运行60秒程序中有20秒运算能够加速,那么该百分比就是20/60。部件加速比:可改善部分改善以后性能提升,通常情况下它是大于 。比如: 系统改善后实施程序,其中可改善部分花费2秒时间,而改善前该部分需花费5秒,则性能提升为5/2。总实施时间改善后 = 不可改善部分实施时间
13、 +可改善部分改善后实施时间总实施时间改善后=(1-可改善百分比)总实施时间改善前+ =(1-可改善百分比) + 总实施时间改善前 系统加速比 = =Amdahl定律:性能递减规则假如仅仅对计算机中一部分做性能改善,则改善越多,系统取得效果越小。1)可改善百分比为,这时系统加速比等于,即系统性能无法提升。2)部件加速比趋于无穷,这时分母中可改善百分比和部件加速比之比趋于,由此系统加速比趋于除以减可改善百分比,这是加速这个部件所取得系统性能改善极限。 推论:假如只针对整个任务一部分进行优化,那么所取得加速比小于1/(1-fe)。28程序局部性原理程序在实施时所访问地址分布不是随机,而是相对地簇聚
14、;这种簇聚包含指令和数据两部分。程序时间局部性:程序立即用到信息很可能就是现在正在使用信息。程序空间局部性:程序立即用到信息很可能和现在正在使用信息在空间上相邻或临近。29CPU性能将程序实施时间进行分解 (1) 计算机工作时钟频率:计算机系统中和实现技术和工艺相关原因。单位是MHz(f)。 (2) 总时钟周期数程序实施cpu时间 =总时钟周期数 / 时钟频率 “指令时钟数”CPI”一个和计算机体系结构相关参数。CPI = 总时钟周期数 / IC IC:程序实施过程中所处理指令数。总CPU时间 = CPI IC / 时钟频率 时钟频率:反应了计算机实现技术、生产工艺和计算机组织。 CPI:反应
15、了计算机实现技术、计算机指令集结构和计算机组织。IC:反应了计算机指令集结构和编译技术对CPU性能公式进行深入细化假设:计算机系统有n种指令; CPIi :第i种指令处理时间; ICi :在程序中第i种指令出现次数; 则程序实施时间为CPU时间 = S (CPIi ICi) / 时钟频率CPI = S (CPIi ICi) / IC = S (CPIi ICi / IC)其中:(ICi / IC)反应了第i种指令在程序中所占百分比。 例1.1假设我们考虑条件分支指令两种不一样设计方法以下:(1) CPUA:经过比较指令设置条件码,然后测试条件码进行分支。 (2)CPUB:在分支指令中包含比较过
16、程在两种CPU中,条件分支指令全部占用2个时钟周期而全部其它指令占用1个时钟周期,对于CPUA,实施指令中分支指令占20%;因为每个分支指令之前全部需要有比较指令,所以比较指令也占20%。因为CPUA在分支时不需要比较,所以假设它时钟周期时间比CPUB快1.25倍。哪一个CPU愈加快?假如CPUA时钟周期时间仅仅比CPUB快1.1倍,哪一个CPU愈加快呢?解:我们不考虑全部系统问题,所以可用CPU性能公式。占用2个时钟周期分支指令占总指令20%,剩下指令占用1个时钟周期。所以CPIA= 0.2 2 + 0.80 1 = 1.2则CPU性能为:总CPU时间A = IC 1.2 时钟周期A依据假设
17、有时钟周期B = 1.25 时钟周期A在CPUB中没有独立比较指令,所以CPUB程序量为CPUA80%,分支指令百分比为:20%/80% = 25%这些分支指令占用2个时钟周期,而剩下75%指令占用1个时钟周期,所以: CPIB = 0.25 2 + 0.75 1 = 1.25因为CPUB不实施比较故:ICB = 0.8 ICA所以CPUB性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.25 时钟周期A) = 1.25 ICA 时钟周期A 在这些假设之下,尽管CPUB实施指令条数较少,CPUA因为有着更短时钟周期,所以比CPUB快。假如CPUA时
18、钟周期时间仅仅比CPUB快1.1倍 则时钟周期B = 1.10 时钟周期ACPUB性能为:总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.10 时钟周期A) = 1.10 ICA 时钟周期A所以CPUB因为实施更少指令条数,比CPUA运行愈加快。30并行性在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或不相同工作。只要时间上相互重合,就存在并行性。同时性两个或多个事件在同一时刻发生并行性。并发性两个或多个事件在在同一时间间隔内发生并行性。 31从实施程序角度看,并行性等级从低到高可分为:(1)指令内部并行:指令内部微操作之间并行。 (2)指令级并行
19、:并行实施两条或多条指令。(3)线程级并行:并发实施多个线程,通常是以一个进程内控制派生多个线程为调度单位。(4)任务级或过程级并行:并行实施两个或多个过程或任务(程序段)。(5)作业或程序级并行:在多个作业或程序间并行。从处理数据角度,并行性等级从低到高能够分为:(1)字串位串: 同时只对一个字一位进行处理。(2)字串位并:同时对一个字全部位进行处理,不一样字之间是串行。(3)字并位串:同时对很多字同一位(称位片)进行处理。(4) 全并行: 同时对很多字全部或部分位进行处理。32提升并行性三种技术路径(1) 时间重合。多个处理过程在时间上相互错开,轮番重合地使用同一套硬件设备各个部分,以加紧
20、硬件周转而赢得速度。 (2) 资源反复。依据“以数量取胜”标准,经过反复地设置资源,尤其是硬件资源,以大幅度提升计算机系统性能。 (3) 资源共享。这是一个软件方法,它使多个任务按一定时间次序轮番使用同一套硬件设备。33单机系统中并行性发展 (1) 在发展高性能单处理机过程中,起着主导作用是时间重合这个路径。实现时间重合基础:部件功效专用化。 把一件工作按功效分割为若干相互联络部分; 把每一部分指定给专门部件完成; 然后按时间重合标准把各部分实施过程在时间上重合起来,使全部部件依次分工完成一组一样工作。(2) 在单处理机中,资源反复利用已经普遍起来。部件冗余;多操作部件,多存放体;并行处理机,
21、相联处理机;同构型(对称型)多处理机系统(3) 资源共享实质:用单处理机模拟多处理机功效,形成所谓虚拟机概念。多道程序,分时系统;智能终端;分布处理系统分布处理系统把若干个含有独立功效处理机(或计算机)相互连接起来,在操作系统全盘控制下,统一协调地工作,而最少依靠集中程序、数据或硬件。34多机系统中并行性发展(1) 耦合度。反应多机系统各机器之间物理连接紧密程度和交互作用能力强弱。最低耦合:耦合度最低系统。除经过某种中间存放介质之外,各计算机之间没有物理连接,也无共享联机硬件资源。松散耦合或间接耦合系统:经过通道或通信线路实现计算机间互连,共享一些外围设备(比如磁盘、磁带等),机间相互作用是在
22、文件或数据集一级进行。紧密耦合系统或直接耦全系统:机间物理连接频带较高,它们往往经过总线或高速开关实现互连,能够共享主存。 (2) 功效专用化。专用外围处理机(松散耦合系统);高级语言处理机、数据库处理机;异构型多处理机系统(3) 机间互连。可重构、容错多处理机;紧密耦合系统; 同构型多处理机系统(4) 网络化。通信处理机,远程网络;局部计算机网;分布处理系统第二章 计算机指令集结构设计1指令集结构分类 (1) 在CPU中操作数存放方法(2) 指令中显式表示操作数个数 (3) 操作数寻址方法 (4) 指令集所提供操作类型 (5) 操作数类型和大小 2CPU中操作数存放方法,是多种指令集结构之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高等 计算机 标准 体系结构
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。