第一章-多元正态分布-PPT.ppt
《第一章-多元正态分布-PPT.ppt》由会员分享,可在线阅读,更多相关《第一章-多元正态分布-PPT.ppt(66页珍藏版)》请在咨信网上搜索。
1、第一章第一章 多元正态分布多元正态分布第一章第一章 多元正态分布多元正态分布1.1 多元分布的基本概念多元分布的基本概念1.2 统计距离和马氏距离统计距离和马氏距离1.3 多元正态分布多元正态分布1.4 均值向量和协方差阵的估计均值向量和协方差阵的估计1.5 常用分布及抽样分布常用分布及抽样分布2第一章第一章 多元正态分布多元正态分布n一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。3第一章第一章 多元正
2、态分布多元正态分布 多元正态分布是最常用的一种多元多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正概率分布。除此之外,还有多元对数正态分布,多项式分布,多元超几何分布,态分布,多项式分布,多元超几何分布,多元多元 分布、多元分布、多元 分布、多元指数分布、多元指数分布等。本章从多维变量及多元分布的分布等。本章从多维变量及多元分布的基本概念开始,着重介绍多元正态分布基本概念开始,着重介绍多元正态分布的定义及一些重要性质。的定义及一些重要性质。41.11.1多元分布的基本概念多元分布的基本概念1.1.1 随机向量随机向量1.1.2 分布函数与密度函数分布函数与密度函数1.1.3 多
3、元变量的独立性多元变量的独立性1.1.4 随机向量的数字特征随机向量的数字特征51.1.1 1.1.1 随机向量随机向量 表示对同一个体观测的表示对同一个体观测的 个变量。若观测了个变量。若观测了 个个体,则可得到如下表个个体,则可得到如下表1-11-1的数据,称每一个个的数据,称每一个个体的体的 个变量为一个样品,而全体个变量为一个样品,而全体 个样品形成一个样品形成一个样本。个样本。假定所讨论的是多个变量的总体,所研究的数假定所讨论的是多个变量的总体,所研究的数据是同时观测据是同时观测 个指标(即变量),又进行了个指标(即变量),又进行了 次次观测得到的,把这观测得到的,把这 个指标表示为
4、个指标表示为 常常用向量用向量6 横看表横看表1-11-1,记,记 ,它表示第它表示第 个样品的观测值。竖看表个样品的观测值。竖看表1-1,1-1,第第 列的元素列的元素 表示对表示对 第个变量第个变量 的的n n次观测数值。下面为表次观测数值。下面为表1-11-1n 21 变量变量序号序号1.1.1 1.1.1 随机向量随机向量71.1.1 1.1.1 随机向量随机向量n因此因此,样本资料矩阵可用矩阵语言表示为样本资料矩阵可用矩阵语言表示为:若无特别说明,本书所称向量均指列向量若无特别说明,本书所称向量均指列向量定义定义1.1 设设 为为p个随机变量,由它们组成个随机变量,由它们组成的向量的
5、向量 称为随机向量。称为随机向量。8大家学习辛苦了,还是要坚持继续保持安静继续保持安静91.1.21.1.2 分布函数与密度函数分布函数与密度函数 描述随机变量的最基本工具是分布函数,类似地描述描述随机变量的最基本工具是分布函数,类似地描述随机向量的最基本工具还是分布函数。随机向量的最基本工具还是分布函数。多元分布函数的有关性质此处从略。多元分布函数的有关性质此处从略。定义定义1.2 设设 是是P 维随机向量,它的多元分布维随机向量,它的多元分布函数是函数是式中:式中:101.1.21.1.2 分布函数与密度函数分布函数与密度函数 定义1.3:设 =,若存在一个非负的函数 ,使得 对一切对一切
6、 成立,则称成立,则称 (或(或 )有分布)有分布密度密度 并称并称 为连续型随机向量。为连续型随机向量。11 若若 有密度有密度 ,用,用 分别表示分别表示 和和 的分布密度,则的分布密度,则 和和 独立当且仅当独立当且仅当 (1.5)(1.5)1.1.31.1.3 多元变量的独立性多元变量的独立性 对一切对一切 成立。若成立。若 为为 的联合分布函数,的联合分布函数,分别为分别为X X和和Y Y的分布函数,则的分布函数,则X与与Y 独立当且仅当独立当且仅当 (1.41.4)定义定义1.4:两个随机向量:两个随机向量 X 和和 Y 称为是相互独立的,若称为是相互独立的,若注意注意:在上述定义
7、中,在上述定义中,和和 的维数一般是不同的。的维数一般是不同的。121.1.4 1.1.4 随机向量的数字特征随机向量的数字特征1 1、随机向量、随机向量 X X的均值的均值 设设 有有P P个分量。若个分量。若 存在,我们定义随机向量存在,我们定义随机向量X X的均值为的均值为:当当 为常数矩阵时,由定义可立即推出如下性质:为常数矩阵时,由定义可立即推出如下性质:.(1.6)131.1.4 1.1.4 随机向量的数字特征随机向量的数字特征2、随机向量、随机向量 自协方差阵自协方差阵141.1.4 1.1.4 随机向量的数字特征随机向量的数字特征当当A A、B B为常数矩阵时,由定义可推出协差
8、阵有如下性质:为常数矩阵时,由定义可推出协差阵有如下性质:3 3、随机向量、随机向量X X 和和Y Y 的协差阵的协差阵 设设 分别为分别为 维和维和 维随机向量,它们之间的协方差阵定义为一个维随机向量,它们之间的协方差阵定义为一个 矩矩阵,其元素是阵,其元素是 ,即即 151.1.4 1.1.4 随机向量的数字特征随机向量的数字特征(3)设)设X为为 维随机向量,期望和协方差存在记维随机向量,期望和协方差存在记 则则 对于任何随机向量对于任何随机向量 来说,来说,其协差阵其协差阵都是对称阵,同时总是非负定(也称都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。半正定)的。大多
9、数情形下是正定的。161.1.4 1.1.4 随机向量的数字特征随机向量的数字特征 4 4、随机向量、随机向量X X 的相关阵的相关阵 若随机向量 的协差阵存在,且每个分量的方差大于零,则X X的相关阵定义为:也称为分量 与 之间的(线性)相关系数。17 在数据处理时,为了克服由于指标的量纲不同对统计分在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用某种统计分析方法之前,常析结果带来的影响,往往在使用某种统计分析方法之前,常需将每个指标需将每个指标“标准化标准化”,即做如下变换,即做如下变换1.1.4 1.1.4 随机向量的数字特征随机向量的数字特征何为标准化?何为
10、标准化?标准化的作用?标准化的作用?181.2 1.2 统计距离和马氏距离统计距离和马氏距离欧氏距离欧氏距离马氏距离马氏距离191.2 1.2 统计距离和马氏距离统计距离和马氏距离欧氏距离欧氏距离 在多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上的点P=(x1,x2)到原点O=(0,0)O=(0,0)的欧氏距离,依勾股定理有201.2 1.2 统计距离和马氏距离统计距离和马氏距离 但就大部分统计问题而言,欧氏距离是不能令人满意的。这里因为,每个坐标对欧氏距离的贡献是同等的
11、。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使得变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。欧氏距离还有一个缺点,这就是当各个分量为不同性质的量时,“距离”的大小竟然与指标的单位有关。211.2 1.2 统计距离和马氏距离统计距离和马氏距离 例如,横轴 代表重量(以kg为单位),纵轴 代表长度(以cm为单位)。有四个点A、B、C、D见图1.1,它们的坐标如图1.1所示221.2 1.2 统计距离和马氏距离统计距离和马氏距离这时显然AB比CD要长。结果CD反而比AB长!这显然是不够合理的。现在,如果 用mm作单位,单位保持不变
12、,此时A坐标为(0,50),C坐标为(0,100),则231.2 1.2 统计距离和马氏距离统计距离和马氏距离 因此,有必要建立一种距离,这种距离要能够体现各个变量在变化大小上的不同,以及有时存在着的相关性,还要求距离与各变量所用的单位无关。看来我们选择的距离要依赖于样本方差和协方差。因此,采用“统计距离”这个术语,以区别通常习惯用的欧氏距离。最常用的一种统计距离是印度统计学家马哈拉诺比斯(Mahalanobis)于1936年引入的距离,称为“马氏距离”。241.2 1.2 统计距离和马氏距离统计距离和马氏距离 下面先用一个一维的例子说明欧氏距离与马氏距离在概率上的差异。设有两个一维正态总体
13、。若有一个样品,其值在A处,A点距离哪个总体近些呢?由图1-2图1-2251.2 1.2 统计距离和马氏距离统计距离和马氏距离 由图1-2可看出,从绝对长度来看,A点距左面总体G1近些,即A点到 比A点到 要“近一些”(这里用的是欧氏距离,比较的是A点坐标与 到 值之差的绝对值),但从概率观点来看,A点在 右侧约4 处,A点在 的左侧约3 处,若以标准差的观点来衡量,A点离 比A点离 要“近一些”。显然,后者是从概率角度上来考虑的,因而更为合理些,它是用坐标差平方除以方差(或说乘以方差的倒数),从而化为无量纲数,推广到多维就要乘以协方差阵的逆矩阵 ,这就是马氏距离的概念,以后将会看到,这一距离
14、在多元分析中起着十分重要的作用。1m261.2 1.2 统计距离和马氏距离统计距离和马氏距离马氏距离马氏距离 设X、Y从均值向量为从均值向量为,协方差阵为,协方差阵为的总体的总体G中抽取的两个样品,定义X、Y两点之间的马氏距离为两点之间的马氏距离为(1.21)()(),(1/2YXYXYX-=-1dXG(1.22)()(),(1/2X)(XX-=-1Gdm的马氏距离为与总体定义271.2 1.2 统计距离和马氏距离统计距离和马氏距离 设设 表示一个点集,表示一个点集,表示距离,它是表示距离,它是 到到 的函数,可以证明的函数,可以证明,马氏距离符合如下距离的四条基本公马氏距离符合如下距离的四条
15、基本公理理:;(1 1),(2 2)当且仅当当且仅当 ;(3 3)(4 4)28 1.3 1.3 多元正态分布多元正态分布 多元正态分布是一元正态分布的推广。迄今多元正态分布是一元正态分布的推广。迄今为止为止,多元分析的主要理论都是建立在多元正态多元分析的主要理论都是建立在多元正态总体基础上的总体基础上的,多元正态分布是多元分析的基础。多元正态分布是多元分析的基础。另一方面,许多实际问题的分布常是多元正态分另一方面,许多实际问题的分布常是多元正态分布或近似正态分布,或虽本身不是正态分布,但布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于多元正态分布。它的样本均值近似于多元正态分布。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 多元 正态分布 PPT
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。