字符编码.pptx
《字符编码.pptx》由会员分享,可在线阅读,更多相关《字符编码.pptx(49页珍藏版)》请在咨信网上搜索。
1、1字字 符符 编编 码码2提提 纲纲w一一 计算机中字符的表示(计算机中字符的表示(ASCIIASCII码)码)w二二 计算机中中文字符的表示计算机中中文字符的表示3概 述在计算机中,各种信息都是以二进制编码的形式存在在计算机中,各种信息都是以二进制编码的形式存在 不管是文字、图形、声音、动画,还是电影等信息,在计算机中都是以和组成的二进制代码表示计算机之所以能区别这些不同的信息,是因为它们采计算机之所以能区别这些不同的信息,是因为它们采用的编码规则不同用的编码规则不同 比如:同样是文字,英文字母与汉字的编码规则就不同,前者采用单字节的ASCII码,后者采用双字节的汉字内码但随着需求的变化,这
2、两种编码有被统一的但随着需求的变化,这两种编码有被统一的UNICODE码(由码(由Unicode 协会开发的能表示几乎世界上所有书写协会开发的能表示几乎世界上所有书写语言的字符编码标准)所取代的趋势语言的字符编码标准)所取代的趋势一、计算机中字符的表示(ASCII码)wASCII(American Standard Code for American Standard Code for Information InterchangeInformation Interchange,美国标准信息交换码)规定了常用的数字、字符的编码。标准ASCII码采用7位二进制编码,对应的ISO标准为ISO646
3、标准,最多可以表示128个字符。每个字符可以用一个字节表示,字节的最高位为0。5ASCII码表(二进制)高高3位位低低4位位00000101001110010111011100000000NULDLESP0Pp00010001SOHDC1!1AQaq00100010STXDC22BRbr00110011ETXDC3#3CScs01000100EOTDC4$4DTdt01010101ENQNAK%5EUeu01100110ACKSYN&6FVfv01110111BELETB7GWgw10001000BSCAN(8HXhx10011001HTEM)9IYiy10101010LFSUB*:JZjz1
4、0111011VTESC+;Kk11001100FFFS,Nn11111111SIUS/?O_oDEL基本ASCII码字符的分类n显示字符显示字符范围为33126,共94个,指能从键盘输入、可以显示和打印的字符。n控制字符控制字符 范围是032和127,共34个,主要用于控制输入、输出设备。6字符字符ASCII编码编码十进制值十进制值控制字符0000,00000010,0000和0111,1111032,12732,1270 90 900110011,0000000000110011,10011001 48485757AZAZ01000100,0001000101010101,10101010
5、 6590a za z0110,00010111,101097122符号其余32个基本ASCII码字符的内容解读基本ASCII码字符内容w第032号及第127号共34个,为非打印字符,是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等。w第33126号共94个可打印字符,其中第4857号为09十个阿拉伯数字;6590号为26个大写英文字母,97122号为26个小写英文字母,第127个(126号)为“”,其余为一些标点符号、运算符号等。从键盘上按键输入从键盘上按键输入“CH
6、INA”CHINA”的字串,传送进计的字串,传送进计算机的算机的,则是则是0100001101000011、0100100001001000、0100100101001001、0100111001001110、0100000101000001这五个二进制数字串。这五个二进制数字串。比较比较字符字符ASCIIASCII码值的大小码值的大小 空格空格空格空格标点符号标点符号标点符号标点符号数字数字数字数字大写字母大写字母大写字母大写字母小写字母小写字母小写字母小写字母十进制数字符号的十进制数字符号的ASCIIASCIIASCIIASCII码值码值码值码值与其与其二进制值二进制值二进制值二进制值的区
7、别的区别10ASCIIASCII码表示码表示 vs.vs.二进制表示二进制表示int型数 10000的表示内存存储形式0010011100010000二进制形式0011000100110000001100000011000000110000ASCII形式文本存储形式1 0 0 0 0213+210+29+28+24=8192+1024+512+256+16关于最高位若在该位置若在该位置1 1,可表示一,可表示一些特殊的符号(图形符)些特殊的符号(图形符)w由于ASCII码只用了字节的七个位,最高位并不使用,所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸ASCII(Extended
8、 ASCII)码,这套内码加上了许多外文和表格等特殊符号,成为目前常用的编码。若将传送数据的该位置若将传送数据的该位置1 1,则用于数据传输校验,则用于数据传输校验w虽然标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1byte=8bit),所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。1112关于数据传输的奇偶校验关于数据传输的奇偶校验 在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验奇偶校验,是指在代码传送过程中用来检验是
9、否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。14ASCII码表基本集(2,10,8,16进制)ASCII码表的扩展集码表的扩展集EASCIIl l扩展扩展ASCIIASCII编码编码(Extended ASCII,(Extended ASCII,延伸美国标准信息交延伸美国标准信息交换码换码)是将基本是将基本ASCIIASCII码由码由7 7位扩充为位扩充为8 8位,表示位,表示256256个字个字符。符。基本
10、基本ASCIIASCII码码:最高位为最高位为0 0,称为基本,称为基本ASCIIASCII码;码;扩充的扩充的ASCIIASCII码:码:最高位为最高位为1 1 1 1,扩充部分编码范围为,扩充部分编码范围为10000000111111111000000011111111,相应的十进制数为,相应的十进制数为128255128255用用ASCIIASCII码码组组成成的的文文件件,称称为为“文文本本文文件件”,其其扩扩展展名名为为.TXT.TXT。1516ASCII码表的扩展集17ASCII码表基本集+扩展集(16进制)Microsoft WindowsIBM PC DOS18二、计算机中中文
11、字符的表示二、计算机中中文字符的表示汉字交换码汉字交换码 又称又称又称又称“国标码国标码国标码国标码”,即,即,即,即GB2312-1980,GB2312-1980,GB2312-1980,GB2312-1980,是中华人民共和国国是中华人民共和国国是中华人民共和国国是中华人民共和国国家标准汉字交换编码。家标准汉字交换编码。家标准汉字交换编码。家标准汉字交换编码。汉字信息在计算机内部也是以二进制方式存放。由于汉字汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的数量多,用一个字节的128种状态不能全部表示出来,因此在种状态不能全部表示出来,因此在1981年我国颁布的年我国颁
12、布的信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集,即准即准GB2312-80方案中规定用两个字节的十六位二进制表示一方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低个汉字,每个字节都只使用低7位(与位(与ASCII码相同),即有码相同),即有128128=16384种状态。种状态。19二、计算机中中文字符的表示二、计算机中中文字符的表示汉字交换码汉字交换码 由于由于ASCII码的码的34个控制代码在汉字系统中也要个控制代码在汉字系统中也要使用,为不致发生冲突,不能作为汉字编码,使用,为不致发生冲突,不能作为汉字编码,128除除去去34只剩只剩94种,所以汉字编
13、码表的大小是种,所以汉字编码表的大小是9494=8836,用以表示国标码规定的汉字,用以表示国标码规定的汉字6763个个(一级汉字,是最常用的汉字,按汉语拼音字母顺(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共序排列,共3755个;二级汉字,属于次常用汉字,个;二级汉字,属于次常用汉字,按偏旁部首的笔划顺序排列,共按偏旁部首的笔划顺序排列,共3008个),数字、个),数字、字母、符号等字母、符号等682个,共个,共7445个。个。20二、计算机中中文字符的表示二、计算机中中文字符的表示汉字交换码汉字交换码 国家标准将每个汉字和图形符号的两个字节分国家标准将每个汉字和图形符号的两个字节分
14、别用两位的别用两位的十进制十进制编码(不足补),前字节的编编码(不足补),前字节的编码称为区码,后字节的编码称为位码,排列在一个码称为区码,后字节的编码称为位码,排列在一个9494行行9494列的二维代码表中,形成列的二维代码表中,形成区位码区位码表。表。如如“保保”字在二维代码表中处于字在二维代码表中处于1717区第区第0303位,位,区位码即为区位码即为17031703D D 。把区位码按把区位码按一定的规则一定的规则转换成的二进制代码叫转换成的二进制代码叫做信息交换码(简称国标码)。做信息交换码(简称国标码)。21二、计算机中中文字符的表示二、计算机中中文字符的表示汉字交换码汉字交换码w
15、国标码并不等于区位码,它是由区位码稍作转换得到,国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,这样就得了一个与国标码有一个相对位的区码和位码,这样就得了一个与国标码有一个相对位置差(置差(20H)的代码;再将这个代码的第一个字节和第)的代码;再将这个代码的第一个字节和第二个字节分别加上二个字节分别加上20H,就得到国标码。,就得到国标码。w如:如:“保保”字的国标码为(字的国标码为(3123)H,它是经过下面的,它是经过下面的转换得到的:转换得到的:w w w国标码很少直接使用。国标
16、码很少直接使用。22GB码简介w国标码(GB)是指1981年我国公布的国家标准信息交换用汉字编码字符集基本集,包含:简化汉字,符号,字母,日文假名,共7445个字符;其中包含了6763个汉字,并分作两级:一级为常用字,3755个,按照拼音排序二级为次常用字,3008个,按照部首排序。23GB码的编码空间w一个字符的国标码由两个部分组成,分别是该字符的区号和位号。wGB码规定共有94个区,每个区中有94个位。编码空间为:94*94=8836 个码位1 9 区是西文字母、数字、日文假名、图形符号1687区是汉字区,其中 16 55 区 是一级汉字(40*94-5=3755个)56 87 区 是二级
17、汉字(32*94=3008个)1015,8894区是用户自定义区24GB码区位示例01区78位25GB码区位示例(续)26GB码区位示例(续)27GB码区位示例(续)28GB码区位示例(续)29二、计算机中中文字符的表示二、计算机中中文字符的表示汉字内码汉字内码 就是汉字在计算机内部所使用的编码。当将汉字通过使就是汉字在计算机内部所使用的编码。当将汉字通过使就是汉字在计算机内部所使用的编码。当将汉字通过使就是汉字在计算机内部所使用的编码。当将汉字通过使用外码输入到计算机中后,计算机为了识别汉字,必须将汉用外码输入到计算机中后,计算机为了识别汉字,必须将汉用外码输入到计算机中后,计算机为了识别汉
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 字符 编码
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。