信息论复习资料傅祖芸版本省公共课一等奖全国赛课获奖课件.pptx
《信息论复习资料傅祖芸版本省公共课一等奖全国赛课获奖课件.pptx》由会员分享,可在线阅读,更多相关《信息论复习资料傅祖芸版本省公共课一等奖全国赛课获奖课件.pptx(248页珍藏版)》请在咨信网上搜索。
1、信息论与编码信息论与编码计算器1第1页简简 介介 是一门应用概率论、随机过程、数理统计和是一门应用概率论、随机过程、数理统计和近代代数方法,来研究信息传输、提取和处理近代代数方法,来研究信息传输、提取和处理中普通规律学科。中普通规律学科。奠基人:美国数学家香农(奠基人:美国数学家香农(C.E.ShannonC.E.Shannon)19481948年年“通信数学理论通信数学理论”2第2页简简 介介l信息论基本问题信息论基本问题信息度量信息度量l无失真信源编码定理无失真信源编码定理香农第一定理香农第一定理l信道编码定理信道编码定理香农第二定理香农第二定理l信源编码、信道编码信源编码、信道编码3第3
2、页绪绪 论论第第1 1章章4第4页1.1 1.1 信息概念信息概念 5第5页情报:情报:是人们对于某个特定对象所见、所闻、所是人们对于某个特定对象所见、所闻、所了解而产生知识。了解而产生知识。知识:知识:一个含有普遍和概括性质高层次信息一个含有普遍和概括性质高层次信息 ,以实践为基础,经过抽象思维,对客观事物规律以实践为基础,经过抽象思维,对客观事物规律性概括。性概括。消息:消息:用文字、符号、语音、图像等能够被人们用文字、符号、语音、图像等能够被人们感觉器官所感知形式,把客观物质运动和主观思感觉器官所感知形式,把客观物质运动和主观思维活动状态表示出来。维活动状态表示出来。几个常见概念几个常见
3、概念6第6页香农信息度量香农信息度量(1 1)样本空间)样本空间 某事物各种可能出现不一样状态。某事物各种可能出现不一样状态。(2 2)概率测度)概率测度 对每一个可能选择消息指定一个概率。对每一个可能选择消息指定一个概率。(3 3)概率空间)概率空间 l先验概率先验概率p p(x xi i):选择符号选择符号x xi i作为消息概率。作为消息概率。样本空间概率测度7第7页l例:例:气象预报气象预报 甲甲乙乙l“甲地晴甲地晴”比比“乙地晴乙地晴”不确定性小。不确定性小。l某一事物状态出现概率越小,其不确定性越大。某某一事物状态出现概率越小,其不确定性越大。某一事物状态出现概率靠近于一事物状态出
4、现概率靠近于1,1,即预料中必定会出现即预料中必定会出现事件,那它不确定性就靠近于零。事件,那它不确定性就靠近于零。8第8页 对对x xi i不确定性可表示为先验概率不确定性可表示为先验概率p(xp(xi i)倒倒数某一函数。数某一函数。(4 4)自信息)自信息(5 5)互信息)互信息 先验不确定性减去尚存不确定性。先验不确定性减去尚存不确定性。后验概率后验概率p p(a ai i|b bj j):接收端收到消息接收端收到消息b bj j后而后而发送端发是发送端发是a ai i概率。概率。9第9页信息特征信息特征信息是信息是物质存在普遍属性物质存在普遍属性,信息和能量、物质要求了事,信息和能量
5、、物质要求了事物物功效和性能功效和性能;接收者在收到信息之前,对它内容是不知道,所以,信接收者在收到信息之前,对它内容是不知道,所以,信息是息是新知识、新内容新知识、新内容;它使认识主体对某一事物未知性;它使认识主体对某一事物未知性或不确定性降低有用知识;或不确定性降低有用知识;信息存在含有信息存在含有普遍性、无限性、动态性、时效性普遍性、无限性、动态性、时效性和和相对相对独立性独立性;信息能够产生,也能够消失,同时信息能够被信息能够产生,也能够消失,同时信息能够被传递、转传递、转换、扩散、复制、贮存、分割换、扩散、复制、贮存、分割,含有,含有可共享性可共享性;信息是信息是能够量度能够量度,信
6、息量有多少差异。,信息量有多少差异。10第10页1.2 1.2 信息论研究对信息论研究对象、目标和内容象、目标和内容11第11页研究对象:通信系统模型研究对象:通信系统模型信信道道信信源源信源编码信源编码加密加密信信道道编编码码干干 扰扰 源源信信宿宿信源解码信源解码解密解密信信道道解解码码加密密钥解密密钥12第12页l信源:信源:发送消息源发送消息源l离散信源离散信源l模拟信源模拟信源信源是信息论主要研究对象之一信源是信息论主要研究对象之一.我们我们不探讨信源不探讨信源内部结构和机理内部结构和机理,而关注,而关注信源输出。信源输出。重点讨论其重点讨论其描述方法及性质描述方法及性质。l信宿:信
7、宿:信息归宿之意,亦即收信者或用户,信息归宿之意,亦即收信者或用户,是信息传送终点或目标地。是信息传送终点或目标地。l信道:信道:传输信息传输信息物理媒介物理媒介。信源、信道、信宿信源、信道、信宿13第13页l信源编码器信源编码器l经过信源编码能够压缩信源冗余度经过信源编码能够压缩信源冗余度,以提升通信以提升通信系统传输消息效率。系统传输消息效率。l信源编码器分为两类信源编码器分为两类l无失真信源编码无失真信源编码:适合用于离散信源或数字信号;:适合用于离散信源或数字信号;l限失真信源编码限失真信源编码:用于连续信源或模拟信号:用于连续信源或模拟信号,如如语音、图像等信号数字处理。语音、图像等
8、信号数字处理。信源编码器与译码器信源编码器与译码器l信源编码器主要指标信源编码器主要指标l是它是它编码效率编码效率。普通来说,效率越高,编译码器。普通来说,效率越高,编译码器代价也将越大。代价也将越大。l信源译码器信源译码器l把信道译码器输出变换成信宿所需消息形式,相把信道译码器输出变换成信宿所需消息形式,相当于当于信源编码器逆过程信源编码器逆过程。14第14页信道编码器与译码器信道编码器与译码器l信道编码信道编码l主要作用是提升信息传送主要作用是提升信息传送可靠性可靠性。l信道编码器作用信道编码器作用l在信源编码器输出代码组上有目标地增加一些监督码在信源编码器输出代码组上有目标地增加一些监督
9、码元元,使之含有检错或纠错能力。使之含有检错或纠错能力。l信道编码主要方法信道编码主要方法l增大码率或频带增大码率或频带,即增大所需信道容量。这恰与信源编即增大所需信道容量。这恰与信源编码相反。码相反。l信道译码器作用信道译码器作用l含有检错或纠错功效含有检错或纠错功效,它能将落在其检错或纠错范围内它能将落在其检错或纠错范围内错传码元检出或纠正错传码元检出或纠正,以提升传输消息可靠性。以提升传输消息可靠性。15第15页1.3 1.3 信息论形成和发展信息论形成和发展16第16页l 信息论是在长久通信工程实践和理论研究基础上发展起来。l简 史l当代信息论是从20世纪代奈奎斯特和哈特莱工作开始:l
10、1924年奈奎斯特(Nyquist)“影响电报速率原因确实定”。l1928年哈特莱(Hartley)“信息传输”一文研究了通信系统传输信息能力,并给出了信息度量方法。信息论形成信息论形成17第17页l19461946年年柯切尔尼柯夫柯切尔尼柯夫学位论文学位论文“起伏噪声下潜在抗干扰理起伏噪声下潜在抗干扰理论论”,依据最小错误概率准则和最小均方误差准则研究了依据最小错误概率准则和最小均方误差准则研究了离散和连续信道最正确接收问题。离散和连续信道最正确接收问题。l19481948年年香农香农权威性长文权威性长文“通信数学理论通信数学理论”,讨论了信源和讨论了信源和信道特征,信道特征,1949194
11、9年香农年香农“噪声中通信噪声中通信”,两论文奠定了当两论文奠定了当代信息论理论基础。代信息论理论基础。l今后,在基本理论和实际应用方面,信息论都得到了巨大今后,在基本理论和实际应用方面,信息论都得到了巨大发展。发展。18第18页第第2 2章章 离散信源及其信息测度离散信源及其信息测度 2.1 2.1 信源数学模型及分类信源数学模型及分类2.2 2.2 离散信源信息熵离散信源信息熵2.3 2.3 信息熵基本性质信息熵基本性质2.5 2.5 离散无记忆扩展信源离散无记忆扩展信源2.6 2.6 离散平稳信源离散平稳信源2.7 2.7 马尔可夫信源马尔可夫信源2.8 2.8 信源剩下度与自然语言熵信
12、源剩下度与自然语言熵19第19页信源信源 产生产生消息消息或或消息序列消息序列源。源。消息消息携带信息,是携带信息,是信息详细形式。信息详细形式。描述方法描述方法 通信过程中,信源发出何种消息是通信过程中,信源发出何种消息是不确定不确定、是是随机。随机。所以,信源可用所以,信源可用随机变量、随机矢量随机变量、随机矢量或或随机随机过程过程(或(或样本空间样本空间及其及其概率测度概率测度)来描述。)来描述。不一样信源依据其输出消息不一样不一样信源依据其输出消息不一样随机性质随机性质进行分类。进行分类。2.1 2.1 信源数学模型及分类信源数学模型及分类20第20页1 1、随机变量描述信源(单符号)
13、、随机变量描述信源(单符号)l特点:特点:输出单符号消息。符号集取值输出单符号消息。符号集取值A:A:aa1 1,a,a2 2,a,aq q 是是有限有限或或可数可数,可用可用离散型随机变量离散型随机变量X X描述。描述。l数学模型:数学模型:设每个信源符号设每个信源符号a ai i出现出现(先验先验)概率概率p(p(a ai i)(i=1,2,q)(i=1,2,q)满足:满足:概率空间概率空间能表征离散信源能表征离散信源统计特征统计特征,所以也称概率空间,所以也称概率空间为为信源空间信源空间。1 1)离散信源)离散信源21第21页1 1)平稳信源)平稳信源l特点特点:信源输出消息由一信源输出
14、消息由一符号序列符号序列所组成。所组成。可用可用N N维随机矢量维随机矢量 X X(X(X1 1,X,X2 2,X,XN N)描述,且描述,且随机矢量随机矢量X X各维概率分布都与时间起点无关各维概率分布都与时间起点无关 。l离散平稳信源:离散平稳信源:每个随机变量每个随机变量X X X Xi i(i(i1,2,N)1,2,N)是取值是取值离散随机变量。离散随机变量。l连续平稳信源:连续平稳信源:每个随机变量每个随机变量X X X Xi i(i(i1,2,N)1,2,N)是取值是取值连续随机变量。连续随机变量。2 2、随机矢量描述信源、随机矢量描述信源22第22页2 2)离散无记忆平稳信源)离
15、散无记忆平稳信源l离散平稳信源离散平稳信源特例,特例,信源发出符号都信源发出符号都相互统计独立,相互统计独立,即各随机变量即各随机变量X Xi i (i1,2,N)之间统计独立。之间统计独立。l性质:性质:l独立独立P(X)=P(XP(X)=P(X1 1,X,X2 2,X,XN N)=P)=P1 1(X(X1 1)P)P2 2(X(X2 2)P)PN N(X(XN N)l平稳平稳PP1 1(X(Xi i)=P)=P2 2(X(Xi i)=P)=PN N(X(Xi i)=P(X)=P(Xi i)(下标下标1-N1-N为时间标志为时间标志)N N维随机维随机矢量矢量一个取值,一个取值,i i(a(
16、ai1i1 a ai2i2aaiNiN)P(aP(aikik)是符号集是符号集A A一维概一维概率分布率分布若各随机变量若各随机变量X Xi取值一样符号集取值一样符号集A:A:a a1 1,a,a2 2,a,aq q,则则23第23页信源信源X X各输出各输出X Xi i间统计独立、且取值同一符号集间统计独立、且取值同一符号集A A。该信源。该信源输出输出N N维维随机矢量随机矢量X X为为离散无记忆信源离散无记忆信源X XN N次扩展信源。次扩展信源。此扩展信源取值为符号集此扩展信源取值为符号集 i i(a(ai1i1a ai2i2aaiNiN),),其中其中(i(i1 1,i,i2 2,i
17、,iN N=1,2=1,2 ,q),q),其其数学模型数学模型是是X X信源空间信源空间N N重空间:重空间:3 3)离散无记忆信源)离散无记忆信源N N次扩展信源次扩展信源 若若X为为离散无记忆信源:离散无记忆信源:24第24页4 4)有记忆信源)有记忆信源 信源在不一样时刻发出信源在不一样时刻发出符号之间是相互依赖,符号之间是相互依赖,即信源输出即信源输出随随机序列机序列X X中,各随机变量中,各随机变量Xi之间相互依赖。之间相互依赖。须使用随机矢量须使用随机矢量联合概率分布联合概率分布和和条件概率分布条件概率分布来说明它们来说明它们之间关联关系。之间关联关系。例:汉字组成汉字序列中,只有
18、依据汉字语法、习惯用语、例:汉字组成汉字序列中,只有依据汉字语法、习惯用语、修辞制约和表示实际意义制约所组成汉字序列才是有意义汉字修辞制约和表示实际意义制约所组成汉字序列才是有意义汉字句子或文章。所以,在汉字序列中前后文字出现是有依赖,是句子或文章。所以,在汉字序列中前后文字出现是有依赖,是彼此相关。彼此相关。25第25页5 5)m m阶马尔可夫信源(非平稳信源)阶马尔可夫信源(非平稳信源)不一样时刻发出符号间依赖关系不一样时刻发出符号间依赖关系 记忆信源记忆长度为记忆信源记忆长度为m+1时,称这种有记忆信源为时,称这种有记忆信源为m阶马阶马尔可夫信源。尔可夫信源。若上述条件概率与时间起点若上
19、述条件概率与时间起点 i 无关,信源输出符号无关,信源输出符号序列可看成为时齐马尔可夫链,则此信源称为序列可看成为时齐马尔可夫链,则此信源称为时齐马尔时齐马尔可夫信源。可夫信源。26第26页2.2 2.2 离散信源信息熵离散信源信息熵 基本离散信源:基本离散信源:输出输出单符号单符号消息,且这些消息间两两互不相容。用消息,且这些消息间两两互不相容。用一维随机变量一维随机变量X来描述信源输出,其数学模型可抽象为来描述信源输出,其数学模型可抽象为:问题:问题:问题:问题:这么信源能输出多少信息这么信源能输出多少信息这么信源能输出多少信息这么信源能输出多少信息?每个消息出现携带多少信息量每个消息出现
20、携带多少信息量每个消息出现携带多少信息量每个消息出现携带多少信息量?27第27页信息度量信息度量l关键点:关键点:l信息度量(信息量)和信息度量(信息量)和不确定性消除不确定性消除程度相关,程度相关,消除不确定性消除不确定性取得信息量;取得信息量;l不确定性就是随机性,能够用概率论和随机过程来测度;不确定性就是随机性,能够用概率论和随机过程来测度;l推论:推论:l概率小概率小 信息量大,即信息量是信息量大,即信息量是概率单调递减函数;概率单调递减函数;l信息量应该含有信息量应该含有可加性;可加性;l信息量计算公式为(香农(自)信息量度量):信息量计算公式为(香农(自)信息量度量):28第28页
21、2.1.1 2.1.1 自信息自信息 设离散信源设离散信源X概率空间为:概率空间为:I(aI(ai i)代表两种代表两种含义:含义:(1)当事件当事件ai发生以前,表示事件发生以前,表示事件ai发生发生不确定性不确定性(2)当事件)当事件ai发生以后,表示事件发生以后,表示事件ai所提供所提供信息量信息量自信息量:自信息量:事件事件ai发生所含有信息量发生所含有信息量29第29页度量单位度量单位l计算自信息量时要注意相关事件发生概率计算;计算自信息量时要注意相关事件发生概率计算;l自信息量自信息量单位单位取决于对数底;取决于对数底;l底为底为2 2,单位为,单位为“比特比特(bit,binar
22、y unit)”;l底为底为e e,单位为,单位为“奈特奈特(nat,nature unit)”;l底为底为1010,单位为,单位为“哈特哈特(hat,Hartley)”;l依据换底公式得:依据换底公式得:n普通计算都采取以普通计算都采取以“2”2”为底对数,为了书写简练,常把底为底对数,为了书写简练,常把底数数“2”2”略去不写略去不写1 nat=1.44bit,1 hat=3.32 bit1 nat=1.44bit,1 hat=3.32 bit;30第30页收信者收信者收到某消息收到某消息取得信息量取得信息量 不确定性降低量不确定性降低量 (收到此消息前关于某事件不确定性收到此消息前关于某
23、事件不确定性)-(-(收到此消息后关于某事件不确定性收到此消息后关于某事件不确定性)通信实质?通信实质?即:传递信息,消除不确定性。即:传递信息,消除不确定性。即:传递信息,消除不确定性。即:传递信息,消除不确定性。31第31页2.2.2 2.2.2 信息熵信息熵l对对一一个个信信源源发发出出不不一一样样消消息息所所含含有有信信息息量量也也不不一一样样。所所以以自自信信息息I(aI(ai i)是是一一个个随随机机变变量量,不不能能用用它它来来作作为为整整个个信信源源信息测度。信息测度。l信息熵:信息熵:自信息数学期望,自信息数学期望,平均自信息量平均自信息量H Hr r(X)(X):r r进制
24、单位进制单位/符号符号32第32页熵含义熵含义l熵是熵是从整个集合统计特征从整个集合统计特征来考虑,它从平均意义上来考虑,它从平均意义上来表征信源总体特征。来表征信源总体特征。l信源输出前,信源输出前,熵熵H(X)H(X)表示信源表示信源平均不确定性;平均不确定性;l信源输出后,信源输出后,熵熵H(X)H(X)表示每个消息表示每个消息平均信息量;平均信息量;l信息熵信息熵H(X)H(X)表征了变量表征了变量X X随机性。随机性。33第33页 信息熵是信息熵是信源概率空间信源概率空间一个特殊函数。这个函数取值大一个特殊函数。这个函数取值大小,与信源小,与信源符号数符号数及其及其概率分布概率分布相
25、关。相关。用用概概率矢量率矢量P P来表示来表示概概率分布率分布P P(x x):3.3 3.3 信息熵基本性质信息熵基本性质 则信息熵则信息熵H(X)H(X)是概率矢量是概率矢量P P或它分量或它分量p p1 1,p p2 2,p pq qq-1q-1元函元函数数(独立变量只有独立变量只有q-1q-1元元)。则。则 H(X)H(X)可写成:可写成:34第34页熵函数向量形式熵函数向量形式lH(P)H(P)是概率矢量是概率矢量P P函数,称为函数,称为熵函数熵函数。l我们用下述表示方法:我们用下述表示方法:l用用H(x)H(x)表示以离散随机变量表示以离散随机变量x x描述描述信源信息熵信源信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 复习资料 傅祖芸 版本 公共课 一等奖 全国 获奖 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。