《多元统计分析》第三版例题习题数据.pdf
《《多元统计分析》第三版例题习题数据.pdf》由会员分享,可在线阅读,更多相关《《多元统计分析》第三版例题习题数据.pdf(41页珍藏版)》请在咨信网上搜索。
1、1何晓群何晓群多元统计分析多元统计分析第三版(第三版(20122012)数据下载)数据下载 第第 2 2 章章 例例 2-1 1999 年财政部、国家经贸委、人事部和国家计委联合发布了国有资本金效绩评价规则。其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为 35 家上市公司 2008 年年报数据,这 35 家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进
2、行分析。表表 2-1行业行业公司简称股票代码净资产收益率总资产报酬率资产负债率总资产周转率流动资产周转率已获利息倍数销售增长率资本积累率深圳能源0000279.174.9253.45.391.573.562.7633.00深南电000037.611.2361.17.601.741.41-12.81-.01富龙热电000426-11.30-5.5648.89.13.76-.34-40.10-9.93穗恒运000531-7.70-1.5370.25.572.70.61-29.45-7.15粤电力000539.34-1.1554.84.482.42.5211.78-7.72韶能股份000601-2.
3、95-1.2961.79.272.52.5315.77-4.67ST 惠天 000692-1.86-.8163.34.401.09.438.08-1.82城投控股60064912.288.4639.92.25.5740.2029.21-2.19大连热电6007191.58.9660.53.32.701.31-3.44.75华电能源600726.43.3377.63.402.391.0812.66-6.04电力、煤气及水的生产和供应业国电电力6007951.26.2071.65.261.681.10-5.885.68长春经开600215.09.2129.10.05.081.239.07.09大龙
4、地产6001591.21.0961.63.04.051.84-57.90-.08金丰投资6006069.786.5146.07.20.316.22-51.99-8.40房地行业新黄浦6006386.815.9631.91.12.315.57-18.484.992浦东金桥6006399.026.1642.74.20.864.5140.624.75外高桥6006486.902.0978.11.702.477.0419.885.21中华企业60067514.316.8263.67.37.445.8933.9311.82渝开发0005146.535.1431.61.14.404.42-15.566.6
5、4莱茵置业00055821.227.9573.67.44.521.04-13.1528.42粤宏远000573-8.47-4.8444.12.14.24-3.90-26.72-7.81中国国贸6000078.406.2148.06.123.041.101.205.06万科 A00000212.655.7767.44.37.3910.6215.388.93三木集团0006321.961.0580.12.88.951.74-11.30-9.55国兴地产0008382.972.2144.34.17.1730.65-74.763.06中关村0009319.691.7280.11.47.572.03-7
6、.901.59中兴通讯00006311.655.0270.15.981.214.2827.3617.40长城电脑0000661.01.3953.931.353.571.22-6.99-30.87南天信息0009489.486.6145.431.061.414.6215.13110.72同方股份6001003.572.6353.32.78.002.79-4.7726.72永鼎股份6001052.541.6971.91.42.631.8727.492.63宏图高科60012210.715.4257.491.772.123.2133.0311.23新大陆0009974.543.7431.88.861
7、.097.4918.42-6.27方正科技6006014.423.1643.951.404.673.06-13.584.73信息技术业复旦复华6006244.443.6849.44.53.853.1913.572.60习题习题 3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等 9 个内陆边远省份。选取人均 GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占 15 岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。边远及少数民族聚居区的社会经济水平发展的指标数据:地区人均GD
8、P三产比重人均消费人口增长文盲半文盲3内蒙古506831.121418.2315,83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.1205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92数据来源:中国统计年鉴(1998)。5 项指标的全国平均水平0=(6212.01 32.87 2972 9.5 15.78)/第第 3
9、章章例例 3-13-1 若我们需要将下列 11 户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表 3-1。在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。表 3-1 某市 2001 年城镇居民户主个人收入数据X1 职工标准工资收入 X5 单位得到的其他收入X2 职工奖金收入 X6 其他收入X3 职工津贴收入 X7 性别X4 其他工资性收入 X8 就业身份X1X2X3X4X5X6X7X8540.000.00.00.00.06
10、.00男国有1137.00125.0096.000.0109.00812.00女集体1236.00300.00270.000.0102.00318.00女国有1008.000.096.000.086.0246.00男集体1723.00419.00400.000.0122.00312.00男国有1080.00569.00147.00156.00210.00318.00男集体1326.000.0300.000.0148.00312.00女国有1110.00110.0096.000.080.00193.00女集体1012.0088.00298.000.079.00278.00女国有1209.0010
11、2.00179.0067.00198.00514.00男集体1101.00215.00201.0039.00146.00477.00男集体例 3-3EnglishNorwegianDanishDutchGermanFrenchOneEneneeneinunTwoTototweezweideuxThreeTretredriedreitroisFourFirefireviervierquatreFiveFemfemvijffunfeinqSixSekssekszessechssixsevenSjusyvzevensiebcnsept4EightAteotteachtachthuitNineNini
12、negenneunneufTenTititienzehndixSpanishItalianPolishHungarianFinnishUnounojedenegyyksiDosduedwakettokaksiTrestretrzyharomkolmecuatroquattroczterynegyneuaCincocinquepiecotviisiSeixseiszeschatkuusiSietesettesiedemhetseitsemanOchoottoosiemnyolckahdeksaunuevenovedziewieckilencyhdeksanDiezdiecidziesiectiz
13、kymmenen例 3-4X1 食品支出(元/人)X5 交通和通讯支出(元/人)X2 衣着支出(元/人)X6 娱乐、教育和文化服务支出(元/人)X3 家庭设备、用品及服务支出(元/人)X7 居住支出(元/人)X4 医疗保健支出(元/人)X8 杂项商品和服务支出(元/人)X1X2X3X4X5X6X7X8辽宁1772.14568.25298.66352.20307.21490.83364.28202.50浙江2752.25569.95662.31541.06623.05917.23599.98354.39河南1386.76460.99312.97280.78246.24407.26547.1918
14、8.52甘肃1552.77517.16402.03272.44265.29563.10302.27251.41青海1711.03458.57334.91307.24297.72495.34274.48306.45例 3-5 x1 人均粮食支出 (元/人)x5 人均衣着支出 (元/人)x2 人均副食支出 (元/人)x6 人均日用杂品支出 (元/人)x3 人均烟、酒、饮料支出 (元/人)x7 人均水电燃料支出 (元/人)x4 人均其他副食支出 (元/人)x8 人均其他非商品支出 (元/人)x1x2x3x4x5x6x7x8 北 京21.30124.8935.4373.9893.0120.5843.9
15、7433.73 天 津21.50122.3929.0851.6455.0411.3054.88288.13 河 北18.2590.2124.4532.4462.487.4547.50178.84 山 西21.8466.3818.0531.3274.488.1934.97177.45 内蒙古21.3767.0820.2835.2781.0710.9439.46182.20 辽 宁22.74115.8828.2142.4458.079.6348.65194.85 吉 林20.2288.9418.5435.6365.728.8150.29186.52 黑龙江21.3375.5014.0029.566
16、9.298.2442.08165.90 上 海21.13168.6940.8170.1274.3215.4650.90422.745 江 苏18.61122.5127.0742.5063.4715.3836.14240.92 浙 江19.96142.2443.3350.74101.7712.9253.44394.55 安 徽19.61107.1332.8535.7761.347.5334.60142.23 福 建25.56171.6522.3040.5357.1312.6054.03225.08 江 西18.75104.6815.5535.6151.8011.1836.27142.72 山 东
17、18.2788.3419.0743.1972.9812.5942.16200.18 河 南19.0773.1818.0129.3864.518.9138.14155.45 湖 北18.76102.6721.8730.4764.3311.9942.14168.17 湖 南20.25104.4520.7238.1562.9812.6739.16213.56 广 东23.68173.3017.4343.5953.6616.8665.02385.94 广 西18.70131.3511.6932.0641.5410.8442.77178.51 海 南16.16139.9212.9823.5824.871
18、0.7632.35144.21 重 庆18.18120.3926.1837.9468.1611.6438.48246.37 四 川18.53109.9521.4933.0450.9810.8833.96183.85 贵 州18.3392.4325.3832.1956.3214.0038.57144.82 云 南22.3099.0833.3632.0152.067.0432.85190.04 西 藏29.67146.9064.5154.3686.1014.7732.19193.10 陕 西20.0370.7519.7534.9553.2910.5538.20189.41 甘 肃18.6872.7
19、423.7238.6962.419.6535.26170.12 青 海20.3375.6420.8833.8653.8110.0632.82171.32 宁 夏19.7570.2418.6736.7161.7510.0840.26165.22 新 疆21.0378.5514.3534.3364.989.8333.87161.67第第 4 章章例例 4-1 判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是 1936年 Fisher 的鸢尾花数据(Iris Data)。鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的
20、,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。该数据给出 150 个鸢尾花的萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)、花瓣宽(petal width)以及这些花分别属于的种类(Species)等共五个变量。萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值 Setosa、Versicolour、Virginica)。这里三种鸢尾花各有 50 个观测值。数据格式如下图所示:6定义新的变量 y 为被解释变量,用“1”代表 Setosa 鸢尾花,用“2”代表 Ver
21、sicolour 鸢尾花,用“3”代表 Virginica 鸢尾花,将萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽(petal width)四个变量作为解释变量。使用 SPSS 软件中的 AnalyzeClassifyDiscriminant,就进入了判别分析的对话框。分组变量(Grouping Variable)选择 y,然后定义的区域,最小值是 1,最大值是 3。解释变y量(Independents)选择 sepal.length、sepal.width、petal.length 和 petal.width。统计量(Sta
22、tistics)选项中选择描述统计量 Means,Univariate ANOVAs 和 BoxM,函数选择 Fisher 和非标准化函数,矩阵选择 Within-groups correlation。分类(Classify)选项中7选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是 50 种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewise results),综合表(Summery Table)和“留一个在外”(Leave-one-out classifation)的验证原则,协方差矩阵选择Within-groups,作图选择 Co
23、mbined-groups。保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。如果采用逐步判别法,我们还可以选择判别的方法(Method)。得到分析结果如下:输出结果输出结果 4-18DiscriminantA An na al ly ys si is s C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y150100.00.00.00.00.0150100.0Unweighted CasesValidMissing or out-of-rangegroup codesAt least one
24、missingdiscriminating variableBoth missing orout-of-range groupcodes and at least onemissing discriminatingvariableTotalExcludedTotalNPercentG Gr ro ou up p S St ta at ti is st ti ic cs s5.006.35255050.0003.428.37915050.0001.462.17375050.000.246.10545050.0005.936.51625050.0002.770.31385050.0004.260.
25、46995050.0001.326.19785050.0006.588.63595050.0002.974.32255050.0005.552.55195050.0002.026.27475050.0005.843.8281150150.0003.057.4359150150.0003.7581.7653150150.0001.199.7622150150.000萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽品种setosaversicolorvirginicaTotalMeanStd.DeviationUnweightedWeightedVa
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 第三 例题 习题 数据
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。