典型相关分析和协整.pptx
《典型相关分析和协整.pptx》由会员分享,可在线阅读,更多相关《典型相关分析和协整.pptx(115页珍藏版)》请在咨信网上搜索。
1、1要点n n典型相关分析的数学表达方式,假定条件;n n典型相关系数的数学含义;n n典型变量系数的数学含义;n n简单相关,复相关和典型相关的意义;n n典型相关的应用一、什么是典型相关分析及基本思想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和p个原材料的指标
2、 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了7070个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351
3、.00变量间的相关系数矩阵y2y3y1x2x1 典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,8 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。二、典型相关的数学描述典型相关的数学描述考虑两组变量的向量考虑两组变量的向量 其协方差阵为(一)想法 其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;是X和Y的其协方差矩阵。如果我们记两组变量的第一对
4、线性组合为:如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求 1和b b1,使uv达到最大。(二)典型相关系数和典型变量的求法 在约束条件:下,求a a1 1和和b b1 1,使uv达到最大。令12利用柯西不等式有(参看1.8.4式)13记m为 12的秩,则记为相应的特征向量为其余的零特征根对应的向量为14由特征向量可以构成一个正交矩阵T,有,有15若取若取则16相应的特征向量为 a1和和b1分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第一对典型变量的系数。第一对典型变量的系数。17第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这
5、部分的信息不够,则还可以在剩余相关中提取第二对典型变量:在以下的约束条件下:18求令则,约束条件等价于1920当取这时uk和vk达到最大值k,称它为第k个典型相关系数,称ak和bk为第k对典型变量系数。21相应的特征向量为 ak和和bk分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第第k对典型变量的系数。对典型变量的系数。22注有相同的特征根,而可以验证:有相同的特征根,而可以验证:根据线性代数的思想,下列矩阵23方法二方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求 的极大值,其中和是 Lagrange乘数。将上面的3式分别左乘
6、和将左乘(3)的第二式,得并将第一式代入,得 的特征根是 ,相应的特征向量为将左乘(3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。在剩余的相关中再求出第二对典型变量和他们的在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:典型相关系数。设第二对典型变量为:在约束条件:求使达到最大的和
7、。29例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了7070个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。30X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的
8、平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956三、典型变量的性质1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:因为特征向量之间是正交的。故2、不同组的典型变量之间
9、相关性 不同组内一对典型变量之间的相关系数为:35同对则协方差为i,不同对则为零。3 3、原始变量与典型变量之间的相关系数、原始变量与典型变量之间的相关系数原始变量相关系数矩阵原始变量相关系数矩阵 X X典型变量系数矩阵y典型变量系数矩阵394142例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了7070个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。43X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.37
10、0.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19
11、000.2956典型变量的结构(相关系数)U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型变量的结构(相关系数)V1V2X10.6787-0.0305X20.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056348 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家
12、庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。504 4、各组原始变量被典型变量所解释的方差、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被
13、vi解释的方差比例 被典型变量解释的被典型变量解释的X组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方Y组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.4208 被典型变量解释的被典型变量解释的Y组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方X组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比
14、例1 0.46890.46890.47330.22190.22192 0.27310.74200.03490.00950.2315535、简单相关、复相关和典型相关之间的关系若p1且q1,则x和y的典型相关就是简单相关;若p1或q1,则x和y的典型相关就是复相关;54五、样本典型相关系数在实际应用中,总体的协方差矩阵常常是未知的,在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数进行
15、估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。估计以后还需要进行有关的假设检验。5511、假设有、假设有X X组和组和Y Y组变量,样本容量为组变量,样本容量为n n。假设。假设(X(X1 1,Y Y1 1),(X),(X2 2,Y,Y2 2),(X),(Xn n,Y,Yn n),观测值矩阵为:,观测值矩阵为:565722、计算特征根和特征向量、计算特征根和特征向量求求MM1 1和和 MM2 2的特征根的特征根,对应的特征向,对应的特征向量量。则特征向量构成典型变量的系数,。则特
16、征向量构成典型变量的系数,特征根为典型变量相关系数的平方。特征根为典型变量相关系数的平方。58六、典型相关系数的检验典典型型相相关关分分析析是是否否恰恰当当,应应该该取取决决于于两两组组原原变变量量之之间间是是否否相相关关,如如果果两两组组变变量量之之间间毫毫无无相相关关性性而而言言,则则不不应应该该作作典典型型相相关关分分析析。用用样样本本来来估估计计总总体体的的典典型型相相关关系系数数是是否否有有误误,需需要进行检验。要进行检验。(一)整体检验检验的统计量:59所以,两边同时求行列式,有事实上6061由于所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得
17、:62在原假设为真的情况下,检验的统计量在原假设为真的情况下,检验的统计量 近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。63 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。64 若原假设若原假设H H0 0被接受,则认为只有第二对典型变被接受,则认为只有第二对典型变量是有用的;若原假设量是有用的;若原假设H H0
18、 0被拒绝,则认为第二对被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。典型变量也是有用的,并进一步检验假设。(二)部分总体典型相关系数为零的检验65如此进行下去.直至对某个k66检验的统计量 近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22(p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。67 H0:当前和后面的典型相关系数均为零当前和后面的典型相关系数均为零 H1:至少当前的典型相关系数为零至少当前的典型相关系数为零LikelihoodRatioApprox FNum DFDen DFPr F 10.50833498134
19、1.2346199900.0001 20.96508130180.838299960.0001可见,前面两对典型变量的相关性是很强的。68职业满意度典型相关分析某调查公司从一个大型零售公司随机调查了某调查公司从一个大型零售公司随机调查了784784人,人,测量了测量了5 5个职业特性指标和个职业特性指标和7 7个职业满意变量。讨论个职业满意变量。讨论 两组指标之间是否相联系。两组指标之间是否相联系。X X组:组:Y Y组:组:X1X1用户反馈用户反馈Y1Y1主管满意度主管满意度X2X2任务重要性任务重要性Y2Y2事业前景满意度事业前景满意度X3X3任务多样性任务多样性Y3Y3财政满意度财政满意
20、度X4X4任务特殊性任务特殊性Y4Y4工作强度满意度工作强度满意度X5X5自主权自主权Y5Y5公司地位满意度公司地位满意度Y6Y6工作满意度工作满意度 Y7Y7总体满意度总体满意度69X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.12
21、0.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.46
22、0.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0070CanonicalCorrelationAnalysisAdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.
23、05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.00328071LikelihoodRatioApproxFNumDFDenDFPrF10.63988477134.42373542018.150.000120.9228094133.82422434848.670.000130.9774354115.26341527578.390.000140.9915203010.65798199820.000150.9967201510.9600399920.0001当前和后面的典型相关系数均为零的检
24、验72U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X组的典型变量73V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.
25、60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y组的典型变量74U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型 相关 分析 和协
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。