信息论基础.doc
《信息论基础.doc》由会员分享,可在线阅读,更多相关《信息论基础.doc(162页珍藏版)》请在咨信网上搜索。
1、信息论基础第一讲 信息的基本概念与预备知识一、信息的基本概念1、信息论是通信的数学理论,是运用数理统计的方法研究信息的传输、存储与处理的科学。2、物质、能量、信息是构成客观世界的三大要素,信息存在于任何事物中,有物质的地方就有信息。3、信息具有的性质(1)无形不具实体性;(2)共享交流者不会失去原有信息,还可获得新的信息,可无限传播,也可限制传播,如设密码、安全措施 ;(3)信息是一种资源永远在产生、更新、演变,取之不尽用之不竭;(4)可度量信息的数量和质量可度量。3、概率信息(香农信息或狭义信息)美国数学家香农(C.E.Shannan)提出,信息源具有随机性不定度,为了消除一定的不定度必须获
2、得与此不定度相等的信息量。(1)甲袋有100个球,50个红,50个人白,取出一个为红;(2)乙袋有100个球,25个红,25个白,25个蓝,25个黑,取出一个为红;概率大,不确定性小,信息量小,。4、消息构成消息的条件:能被通信双方理解,可在通信中进行传递和交换。消息具有不同的形式,如语言、文字、符号、数据、图片等。消息是信息的载荷者,同一消息可以含不同的信息量,同一信息可以用不同形式的消息来载荷。5、信号信号是消息的表现形式,消息是信号的具体内容。信号是消息的载体。6、信息的传输系统信源编码信道译码器信宿二、预备知识1、全概公式2、贝叶斯公式3、条件概率4、乘法公式4、不等式三、自信息的度量
3、1、自信息随机事件发生概率为,则随机事件的自信息量为 。(1)非负性(2)随机性 是随机变量(3)单调性 概率大自信息量小(4)随机事件的不确定性在数量上等于它的自信息量。(5)单位以2为底,记作lb,单位比特(bit);以e为底,记作ln,单位奈特(nat);以10为底,记作lg,单位哈脱来(hat)。常用数值:lb3=1.585 , lbe =1.443 , lb10=3.322 , lb5= 2.322 , lb7= 2.806 ,例1 见教材p9习题2.5一副充分洗乱了的牌(含52张牌),试问(1) 任一特定排列所给出的信息量是多少?(2) 若从中抽取13张牌,所给出的点数都不相同能得
4、到多少信息量?解:(1) 52张牌共有52!种排列方式,假设每种排列方式出现是等概率的则所给出的信息量是:(2) 52张牌共有4种花色、13种点数,抽取13张点数不同的牌的概率如下:补充1设离散无记忆信源,其发出的信息为202120130213001203210110321010021032011223210,求(1) 此消息的自信息量是多少?(2) 此消息中平均每符号携带的信息量是多少?解:(1) 此消息总共有14个0、13个1、12个2、6个3,因此此消息发出的概率是:此消息的信息量是:(2) 此消息中平均每符号携带的信息量是:2、联合自信息 3、条件自信息给定后还存在的不确定性。例2 见
5、教材p9习题2.4居住某地区的女孩子有25%是大学生,在女大学生中有75%是身高160厘米以上的,而女孩子中身高160厘米以上的占总数的一半。假如我们得知“身高160厘米以上的某女孩是大学生”的消息,问获得多少信息量?解:设随机变量X代表女孩子学历Xx1(是大学生) x2(不是大学生)P(X) 0.250.75设随机变量Y代表女孩子身高Yy1(身高160cm) y2(身高 log6不满足信源熵的极值性。解:不满足极值性的原因是。(2)同时掷出两个正常的骰子,也就是各面呈现的概率都为1/6,求:(1) “3和5同时出现”这事件的自信息;(2) “两个1同时出现”这事件的自信息;(3) 两个点数的
6、各种组合(无序)对的熵;(4) 两个点数之和(即2, 3, , 12构成的子集)的熵;(5) 两个点数中至少有一个是1的自信息量。解:(1)(2)(3)两个点数的排列如下:111213141516212223242526313233343536414243444546515253545556616263646566共有21种组合:其中11,22,33,44,55,66的概率是其他15个组合的概率是(4)参考上面的两个点数的排列,可以得出两个点数求和的概率分布如下:(5)8、加权熵P32三、小结1、2、3、4、独立时,5、四、作业 P42 2.9. 2.10 ,2.11,2.15判断题1、2、若
7、X与Y独立,则3、若,则4、5、若X与Y独立,则6、解:1、F(X含一个可能的结果时)2、T (,按公式可算得)3、F4、T5、F6、T(增加条件可以减少不确定性)第三讲 平均互信息一、复习1、 2、3、4、二、平均条件互信息 1、定义2.4.1由提供的关于集的平均条件互信息量为 。2、定理:(可直接用不等式)3、定义:平均互信息4、平均互信息的性质P345、连续随机变量的互信息6、连续随机变量的平均互信息7、性质P388、 连续随机变量的熵 三、举例1、对某城市进行交通忙闲的调查,并把天气分成晴雨两种状态,气温分成冷暖两个状态,调查结果得联合出现的相对频度如下:若把这些频度看作概率测度,求:
8、(1) 忙闲的无条件熵;(2) 天气状态和气温状态已知时忙闲的条件熵;(3) 从天气状态和气温状态获得的关于忙闲的信息。解:(1)根据忙闲的频率,得到忙闲的概率分布如下: (2) 设忙闲为随机变量X,天气状态为随机变量Y,气温状态为随机变量Z 求:(3) 2、有两个二元随机变量X和Y,它们的联合概率为Y Xx1=0x2=1y1=01/83/8y2=13/81/8并定义另一随机变量Z = XY(一般乘积),试计算:(1) H(X), H(Y), H(Z), H(XZ), H(YZ)和H(XYZ);(2) H(X/Y), H(Y/X), H(X/Z), H(Z/X), H(Y/Z), H(Z/Y)
9、, H(X/YZ), H(Y/XZ)和H(Z/XY);(3) I(X;Y), I(X;Z), I(Y;Z), I(X;Y/Z), I(Y;Z/X)和I(X;Z/Y)。解:(1)Z = XY的概率分布如下:(2)(3)四、小结1、2、3、4、5、五、作业: 复习第二章 小测验1一、填空1、( ), ( ), ( ) 2、( ), ( ),( ) 3、( ) , ( ),( ) 4、( ) = ( ) 5、( ),( )= ( )= ( )=( )二、判断题1、 ( )2、 ( ) 3、 ( ) 4、 ( ) 三、计算题1、同时掷出两个骰子,求:(1) “3和5同时出现”这事件的自信息;(2)两个
10、点数中至少有一个是1的自信息量 (3) 两个点数之和的熵;2、给定X、Y的联合概率分布, XY0 1 0 1 0求:(1) , , ; (2) , ;(3) 四、证明 :第四讲 第三章 离散信源一、离散无记忆信源1、定义1 (基本离散信源) 设信源 输出符号 这些符号彼此互不相关,则称为离散无记忆信源。2、定义2 自信息 3、定义3 信源熵4、举例p49二、离散无记忆信源的扩展信源1、二进制信源的扩展(1)基本信源 (2)二次扩展 ,,(3)三次扩展 ,,2、离散无记忆信源的N次扩展信源3、定理 4、举例(1)p53(2)每帧电视图像可以认为是由3105个像素组成的,所有像素均是独立变化,且每
11、像素又取128个不同的亮度电平,并设亮度电平是等概出现,问每帧图像含有多少信息量?若有一个广播员,在约10000个汉字中选出1000个汉字来口述此电视图像,试问广播员描述此图像所广播的信息量是多少(假设汉字字汇是等概率分布,并彼此无依赖)?若要恰当的描述此图像,广播员在口述中至少需要多少汉字?解:1) 128个不同的亮度电平等概出现2) 10000个汉字等概率分布3) 广播员描述此图像至少需要多少汉字三、离散平稳信源1、定义(P55) 概率与时间起点无关。一维平稳信源:二维平稳信源:2、平稳信源的熵P553、极限熵(1)记 由P26有证明:类似地(2)定义(平均符号熵)(3)极限熵注:(4)定
12、理:对任意离散平稳信源,若,则证明:由平稳性所以由 :可得而 又所以(5)举例设有一个信源,它产生0,1序列的信息。它在任意时间而且不论以前发生过什么符号,均按P(0) = 0.4,P(1) = 0.6的概率发出符号。(1) 试问这个信源是否是平稳的?(2) 试计算, H(X3/X1X2)及H;(3) 试计算并写出信源中可能有的所有符号。解:(1) 试问这个信源是否是平稳的?这个信源是平稳无记忆信源。因为有这些词语:“它在任意时间而且不论以前发生过什么符号”(2) 试计算, H(X3/X1X2)及H;(3) 试计算并写出信源中可能有的所有符号。四、小结1、离散无记忆信源:信源 输出符号 这些符
13、号彼此互不相关。2、自信息 信源熵3、离散平稳信源概率与时间起点无关。4、平均符号熵5、极限熵五、作业3.1 3.2 3.3 3.4 小测验21、如果你在不知道今天是星期几的情况下问你的朋友“明天是星期几”?则答案中含有的信息量为( );如果你在知道今天是星期四的情况下提出同样的问题,则答案中含有的信息量为( )。2、有一非均匀的骰子,其任一面出现的概率与该面上的点数成正比,则信息熵为( )。3、一信源有6种输出状态,概率分别为, ,设信源先后发出的符号相互独立,试求:(1) ;(2)消息ABABBA 所含的信息量 和FDDFDF所含的信息量;(3) 。4、已知二维随机变量X、Y的概率分布为
14、, ,求:(1) ;(2) 。5、证明:第五讲 马尔可夫信源一、有限状态马尔可夫链1、定义1(马尔可夫链)设为一随机序列,时间参数集,其状态空间,若对所有,有=则称为马尔可夫链。注:时间离散、状态离散,未来只与现在有关,而与过去无关。2、状态转移概率记当时,称为一步转移概率, 记为当时,称为步转移概率,记为3、状态转移图与状态转移矩阵例1已知状态空间,其中,条件概率(1)画状态转移图;(2)写出状态转移矩阵。解:(1)略;(2) 例2已知状态空间,其中,条件概率(1)画状态转移图;(2)写出状态转移矩阵;(3)写出符号序列01001110001对应的状态序列。解:(1)略;(2) (3)4、定
15、义2(时齐马氏链)马氏链中,即状态转移概率与无关,则称这类马氏链为时齐马氏链。注:对时齐马氏链有切普曼柯尔莫哥洛夫方程若初始状态分布为 ,则例:假设人的健康状况分为健康和疾病两种状态,今年健康、明年保持健康的概率为0.8,今年患病、明年转为健康的概率为0.7,研究若干年后处于两种状态的概率。记第年,表示健康,表示疾病,表示第年处于状态的概率 。5、定义3(遍历性)若时齐马氏链对一切存在不依赖于的极限 ,且 ,则称其具有遍历性,称为平稳分布,其中为初始分布。注:若存在正整数,使所有元素均大于0,则该马氏链是遍历的。6、设稳态分布为,则有例 设有一马氏链,状态转移矩阵 (1)是否具有遍历性?(2)
16、求稳态分布。二、马尔可夫信源设信源的状态空间 ,信源输出符号集 当信源发出一个符号后,所处状态将发生变化。1、(一阶马尔可夫信源)若信源输出的符号序列为 和状态序列 满足下列条件,则称此信源为一阶马尔可夫信源,(1)某一时刻信源符号的输出只与当时的信源状态有关,与之前的状态无关;(2)信源状态只由当前输出符号和前一时刻信源状态唯一确定。状态之间的一步转移概率为 。2、遍历的阶马尔可夫信源的信息熵3、举例(1)设有一个二进制二阶马尔可夫信源,信源符号集为,条件概率为 求信息熵 。解:状态转移矩阵为 符号转移矩阵 .(2)一个马尔可夫过程的基本符号为0,1,2,这三个符号等概率出现,并且具有相同的
17、转移概率,(1)画出一阶马尔可夫过程的状态图,并求稳定状态下的一阶马尔可夫信源熵和信源剩余度;(2)求稳定状态下的二阶马尔可夫信源熵和信源剩余度。解:(1)(2)设类似有(3)p54(配套习题集)设马尔可夫信源的状态集合,符号集,如图所示,求:(1)状态极限概率(稳态分布)和符号极限概率;(2)各状态下输出符号的条件熵;(3) 极限熵。解:(1)状态转移矩阵 状态极限概率(稳态分布) 符号转移矩阵 符号极限概率(2)(3) (三、信源的相关性和剩余度对离散平稳信源相关性:剩余度(冗余度):熵的相对率:信源输出符号间的依赖关系越大、相关长度越长,则信源的实际熵小,剩余度大。四、小结1、稳态分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 基础
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。