实例说明利用Excel进行主成分分析.doc
《实例说明利用Excel进行主成分分析.doc》由会员分享,可在线阅读,更多相关《实例说明利用Excel进行主成分分析.doc(15页珍藏版)》请在咨信网上搜索。
1、方法:1 利用Excel2000进行主成分分析第一步,录入数据,并对进行标准化。【例】一组古生物腕足动物贝壳标本的两个变量:长度和宽度。图1 原始数据和标准化数据及其均值、方差(取自张超、杨秉庚计量地理学基础)计算的详细过程如下: 将原始数据绘成散点图(图2)。主持分分析原则上要求数据具有线性相关趋势如果数据之间不相关(即正交),则没有必要进行主成分分析,因为主成分分析的目的就是用正交的变量代替原来非正交的变量;如果原始数据之间为非线性关系,则有必要对数据进行线性转换,否则效果不佳。从图2 可见,原始数据具有线性相关趋势,且测定系数R2=0.4979,相应地,相关系数R=0.7056。 对数据
2、进行标准化。标准化的数学公式为这里假定按列标准化,式中,分别为第j列数据的均值和标准差,为第i行(即第i个样本)、第j列(即第j个变量)的数据,为相应于的标准化数据,为样本数目。图2 原始数据的散点图图3 标准化数据的散点图 对数据标准化的具体步骤如下: 求出各列数据的均值,命令为average,语法为:average(起始单元格:终止单元格)。如图1所示,在单元格B27中输入“=AVERAGE(B1:B26)”,确定或回车,即得第一列数据的均值;然后抓住单元格B27的右下角(光标的十字变细)右拖至C27,便可自动生成第二列数据的均值。求各列数据的方差。命令为varp,语法同均值。如图1所示,
3、在单元格B28中输入“=VARP(B2:B26)”,确定或回车,可得第一列数据的方差,右拖至C28生成第二列数据的方差。 求各列数据的标准差。将方差开方便得标准差。也可利用命令stdevp直接生成标准差,语法和操作方法同均值、方差,不赘述。 标准化计算。如图1所示,在单元格D2中输入“=(B2-$B$27)/$B$29”,回车可得第一列第一个数据“3”的标准化数值-1.786045,然后按住单元格D2的右下角下拖至D26,便会生成第一列数据的全部标准化数值;按照单元格D2的右下角右拖至E2,就能生成第二列第一个数据“2”的标准化数据-1.806077,抓住单元格E2的右下角下拖至E26便会生成
4、第二列数据的全部标准化数值。 作标准化数据的散点图(图3)。可以看出,点列的总体趋势没有变换,两种数据的相关系数与标准化以前完全相同。但回归模型的截距近似为0,即有,斜率等于相关系数,即有。 求标准化数据的相关系数矩阵或协方差矩阵。求相关系数矩阵的方法是:沿着“工具(T)”“数据分析(D)”的路径打开“分析工具(A)”选项框(图4),确定,弹出“相关系数”对话框(图5),在“输入区域”的空白栏中输入标准化数据范围,并以单元格G1为输出区域,具体操作方法类似于回归分析。确定,即会在输出区域给出相关图4 分析工具选项框图5 相关系数对话框系数矩阵的下三角即对角线部分,由于系对称矩阵,上三角的数值与
5、下三角相等,故未给出(图6),可以通过“拷贝转置粘帖”的方式补充空白部分。图6 标准化数据的相关系数和协方差 求协方差的方法是在“分析工具”选项框中选择“协方差”(图7),弹出“协方差” 选项框(图8),具体设置与“相关系数”类似,不赘述。结果见图6,可以看出,对于标准化数据而言,协方差矩阵与相关系数矩阵完全一样。因此,二者任取其一即可。图7 在分析工具选项框中选择“协方差”图8 协方差选项框 计算特征根。我们已经得到相关系数矩阵为,而二阶单位矩阵为,于是根据公式,我们有按照行列式化为代数式的规则可得根据一元二次方程的求根公式,当时,我们有据此解得,(对于本例,显然,)。这便是相关系数矩阵的两
6、个特征根。 求标准正交向量。将代入矩阵方程,得到在系数矩阵中,用第一行加第二行,化为由此得,令,则有,于是得基础解系,单位化为单位化的公式为()。 完全类似,将代入矩阵方程,得到用系数矩阵的第二行减去第一行,化为于是得到,取,则有,因此得基础解系为,单位化为这里、便是标准正交向量。 求对角阵。首先建立标准正交矩阵P,即有该矩阵的一个特殊性质便是,即矩阵的转置等于矩阵的逆。根据,可知下面说明一下利用Excel进行矩阵乘法运算的方法。矩阵乘法的命令为mmult,语法是mmult (矩阵1的单元格范围,矩阵2的单元格范围)。例如,用矩阵 与矩阵C相乘,首先选择一个输出区域如G1:H2,然后输入“=m
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实例 说明 利用 Excel 进行 成分 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。