《数据分析基础—Python实现》—各章习题答案.pdf
《《数据分析基础—Python实现》—各章习题答案.pdf》由会员分享,可在线阅读,更多相关《《数据分析基础—Python实现》—各章习题答案.pdf(27页珍藏版)》请在咨信网上搜索。
新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现贾俊平著数据分析基础一Python实现#各章习题答案#说明:1.本答案仅供参考。2.本答案主要给出结果,读者可参考教材内容自行进行详细分析。暑楣卷材数据分析基础 py-hon实现 贾俊平等 a中同食大版社1/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第1章 数据分析与Python语言1.1 (4)数值变量。类别变量。数值变量。有序类别变量。无序类别变量。1.2(1)总体是“所有IT从业者”,样本是所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3)无序类别变量。1.3(1)总体是“所有的网上购物者。(2)无序类别变量。1.4(1)分层抽样。(2)100oL5(略)。2/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第2章Python数据处理2.1(1)按姓名(拼音字母)升序排序如下:姓名 统计学 数学营销学管理学会计学1程建功68858489865房文英78845160609高见岭63709185828洪天利58517991857宋丽媛801005373702田思雨74746180696王智强90785972663徐丽娜881004971664张志杰63828978800赵宇翔8591637666(2)统计学分数小于 姓名8 洪天利60的学生如下:统计学 58数学51营销学79管理学 91会计学85数学分数大于等于90 姓名0 赵宇翔3 徐丽娜7 宋丽媛的学生如下:统计学858880数学91100100营销学 63 49 53管理学 7671 73会计学6666702.2(1)被调查者性别和满意度的简单频数分布表如下:性别的简单频数表女 33男 27Name:性别,dtype:int 64满意度的简单频数表比较满意 一般 不满意 非常不满意 非常满意161312109Name:满意度,dtype:int 643/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现(2)被调查者性别和满意度的二维列联表如下:满意度 性别女男 合计一般:8513F满意7512比较满意7916非常不满意6410非常满意549合计332760(3)百分比表如下(读者自己分析):#各行占行合计百分比表满意度一般不满意比较满意非常不满意非常满意性别女24.2421.2121.2118.1815.15男18.5218.5233.3314.8114.81合计21.6720.0026.6716.6715.00#各列占列合计百分比表满意度一般不满意比较满意非常不满意非常满意合计性别女61.5458.3343.7560.055.5655.0男38.4641.6756.2540.044.4445.0#各数据占总和百分比表满意度一般不满意比较满意非常不满意非常满意合计性别女13.3311.6711.6710.008.3355.0男8.338.3315.006.676.6745.0合计21.6720.0026.6716.6715.00100.02.3灯泡使用寿命频数分布表如下(组距=ioo)4/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现使用寿命的分布接近对称分布,且主要集中在69007000小数之间,为20只,占使用寿命分组频数频数百分比(%)累积频数累积频数百分比(%)6500,6600)22.022.06600,6700)55.077.06700,6800)66.01313.06800,6900)1414.02727.06900,7000)2626.05353.07000,7100)1818.07171.07100,7200)1313.08484.07200,7300)1010.09494.07300,7400)33.09797.07400,7500)33.0100100.0总数的26%o2.4#无放回抽取5个地区:宁夏回族自治区丁河北省上海市丁山西省辽宁省#有放回抽取5个地区:r内蒙古自治区安徽省福建省安徽省云南省2.5set.seed(20)#标准正态分布:-0.31232848 0.33928471-0.15590853-0.50178967 0.23556889-1.76360526-1.09586204-1.08776574-0.30517005-0.47374837-0.20059454 0.355196770.68951772 0.41058968-0.56497844 0.59939069-0.16293631 1.60021450.6816272 0.0148801#值为100、标准差为20的正态分布:98.24440736 80.35764319 102.43380957 77.25125428 106.9800515662.8297367963.7650946690.20530578112.0637087776.6563622870.033855899.9894298780.03595844128.33548962 84.34782084#1000之间的均匀分布:520.97597833 684.88447386128.497936670.9971356490.19494766124.3008310294.99358606425.865005129.93130725125.7986411166.12186077 104.5452805584.1358115786.64967017140.9779752794.5498844693.83371077 134.5937606 603.86958425 824.02525935452.41939218918.02345725875.79027614743.67620984202.16524457574.17793488363.92750723621.99871374888.05725583 636.92964801 128.4645628 330.685170092.643113880.493008615.98915219936.32619381221.17913714220.5422753304.35008605608.2444550772.66146354201.51924634899.8276814599.44063173107.71582907548.00488121296.00127513516.1596778421.07400202421.75688121615.78476675140.139436612.9981155 920.87887068 569.5359326 919.8809239 499.41845448 932.3450662 970.97112624 678.696348525/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现546.79270829 10.03533915 774.99546968 122.30308037 517.876748432.6录入数据的结果如下:收入户等级2017 年2018 年2019 年2020 年2021 年0低收入户3750464765458004104221中等偏下户733893301267417024216362中等收入户10508135061827724832316853中等偏上户14823194042604435576456394高收入户28225369574917567132855416/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第3章 数据可视化分析3.1(1)各图形如下7/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现东部地区满意度的帕累托图ao601004020140-120-100-90f 非鬻满点 比较满意 不满意 非常不满总满意度东部地区满意度的瀑布图S0R605040 一 8/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现东部地区满意度的漏斗图,也交满意,非满短一股 不满意,非常不;统东部地区满意度的饼图(2)各图形如下:9/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现满意度(b)东部地区和西部地区满意度的堆积条形图东部 西部满意度10/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现东部地区和西部地区满目度的环形图(3)百分比条形图如下1-0.50-0.25-0.75-中部地区西部满意度非常满意J比较满意 一般不满意|非常不满意0-东玩(4)树状图如下:11/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现(5)雷达图和轮廓图如下:12/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现3.2(1)直方图如下:(2)箱形图如下13/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现180-175-170-矩本 165-160-155-150-子女身离父亲身高 糊母亲身高(3)散点图如下(a)子女身高与父亲身高的点图182.5-180 0-177.5-0 5 0 175.172.170.167 5-165 0-162 5.155 160 165 170 175 180子女身高匝注胀酎(b)子女身高与母亲身高的散点图(4)气泡图如下:14/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现167.5-512.07 5 Z。1&1&16朽1&朽 俗气泡图:气泡大小:子女身高162 5 165 0 167.5 170.0 172.5 175.0 177.5 180.0 182.5父亲身高175170165160155 一 一 一 一 一 Irt1803.3折线图和面积图如下:#折线图折线图106104102100死出2012#面积图2014 20162018202015/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现2001751501251007550252012 2014 2016 2018 202016/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第4章 数据的描述分析4.1(1)各统计量如下:平均数=24.8中位数=24.45四分位数=22,75 26.8 75第80个百分位数=27.3众数0 22.71 22.92 25.03 25.94 27.3dtype:flo at64(2)各统计量如下:极差=12.7四分位差=4.125方差=8.6845标准差=2.9469(3)偏度系数和峰度系数如下:偏度系数=0.2708峰度系数=-0.0243(4)标准分数如下:标准分数-2.1729e+00 9.1510e-01 6.6700e-02-5.1010e-01-8.8 340e-01 2.1367e+008.4720e-01-2.3870e-01-6.1190e-018.4720e-01-1.1000e-03-6.459 0e-01-1.5960e+00-9.5130e-014.7390e-01-3.4050e-013.7210e-011.3460e-013.7210e-017.7930e-01-2.7260e-011.8991e+00-6.459 0e-01-7.8 160e-01-7.1370e-016.6700e-02-8.1550e-011.5259e+001.4580e+00-7.1370e-014.2结果如下:加权平均数=4266.6667加权标准差=1164.8445(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数”女=。=0.10男生体重的离散系数“男=总=0.08。所以女生的体重差异大。(2)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大 约为68%o因此,男生中大约有68%的人体重在55kg至65kg之间。(3)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大17/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现约为95%O因此,女生中大约有95%的人体重在40kg至60kg之间。4.4通过计算标准分数来判断:_%A-又 A_1_%b-又 B_425-400_ZAfn,-二1;ZBF-=F=。.5该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5 个标准差,由于A项测试的标准分数高于B项测试,所以A项测试比较理想。4.5主要描述统计量如下:方法A 方法B 方法C平均数 标准差离散系数165.6 2.1314 0.0129128.7333 1.7512 0.0136125.5333 2.774 0.0221从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他 两种方法。从离散程度来看,三种方法的离散系数分别为:C4=0.0129,CVB=0.0136,CVc=0.0221c方法A的离散程度最小。因此应选择方法Ao4.6主要描述统计量如下运动员(分析由读者完成):标准差极差离散系数偏度系数n平均数中位数亚历山大彼得里夫利2010.01010.150.53102.40.053051-1.659957克里斯蒂安赖茨2010,01510.200.72132.90.072023-1.529250列昂尼德叶基莫夫209.86010.000.52951.90.053707-0.452631基思桑德森209.6809.800.56062.40.057917-1.108916拉尔夫许曼2010.02510.150.57942.50.057792-1.013906罗曼邦达鲁克209.7359.850.8 6163.70.088508-1.50288318/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第5章 推断分析基本方法5.1(1)各概率如下:P(X2510)=0.308538P(400WXW450)=0.006209(2)各概率如下:P(0WXW1.2)=0.38493P(-0.48 WXW0)=0.184386P(X2L2)=0.11507(3)q(0.95)=1.6448545.2(1)P(XWT.5,df=15)=0.077183(2)P(X22,df=20)=0.029633(3)q(P=0.95,df=30)=1.6972615.3(1)Ho:45,%:45。(2)拒绝原假设时,结论为:每100ml中维生素C的含量 45mg。(3)不拒绝原假设时,结论为:没有证据表明每100ml中维生素C的含量不2 45mg。5.4(1)95%置信区间为:55.5564 66.6436。(2)90%置信区间为:57.1789,65.0211.5.5(1)PM2.5 均值的 95%的置信区间:74.943,81.307。(2)提出假设%:之82;匕:V 82。检验统计量=238685,p值=0.008497。拒绝原假设,可以认为该城市空气PM2.5的 平均值显著低于过去的平均值。5.6(1)95%的置信区间:24.4835,26.5365。(2)%:=25,%:W 25。假设总体方差为 5kg:z=0.456158,P=0.648276。假 设总体方差未知:L 039 9,P=03114。两种情况均不拒绝仇,没有证据表明该企业 生产的金属板不符合要求。5.7已知:几=50,p=0.64,a=0Q5,Zoq5/2=L9 6。总体中赞成该项改革的户数比 例的95%的置信区间为:0.507 0.773o19/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现5.8Ho:TI 17o z=2.44058 3,P=0.00733178,拒绝%,该生产商的说法 属实。20/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第6章相关与回归分析162 5 165 0 167.5 170.0 172 5 175.0 身高从散点图可以看出,身高与体重之间为正的线性相关关系。(2)r=0.980292。高度线性相关。6.2(1)回归方程为:y=430.18 9 2-4.7006xo回归系数庆=4.7006表示航班正点率 每增加1%,顾客投诉次数平均下降4.7006次。(2)回归系数检验的P=0.001 a=0.05,拒绝原假设,回归系数显著。(3)80=430.18 9 2-4.7006 X 80=54.1412次(精确预测值=54.139 422)。6.3 (4)回归方程:y=200.0564+6.6453%o腔=9 7.16%,拟合程度较高。P=1.9 39 E-11,回归模型显著。92oo=1529.1259 11o残差和标准化残差如下:Obs Dep Var Population Predicted Value Residual Std Error Residual21/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现012145.68-24.6817.01125870.12-12.1217.9238570.1214.8817.9346874.35-6.3517.92457483.28-9.2817.81569390.82.217.58677295.5-23.517.367812297.3924.6117.2689180.5517.4510.2910125108.216.816.5残差图如下:残差图显示模型基本上合理o22/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第7章时间序列分析7.1照理杷至胭其QEQis(1)2021年简单指数平滑法预测(a=0.3)结果:102.365612。(2)预测值与拟合值的图形图如下:居民消费价格指数的简单指数平滑预测106-105-104-103-102-101-100-99-2005 2010 2015 2020时间(3)预测的残差图如下:23/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现简单指数平滑预测的残差图2001 2004 2007 2010 2013 2016 2019时间7.2(i)环比增长率和定基如下:年份国内生产总值环比增长率()定基增长率()02011487940.2NaN01201253858010.3810.3822013592963.210.121.5232014643563.18.5331.8942015688858.27.0441.1852016746395.18.3552.9762017832035.911.4770.5272018919281.110.4988.482019986515.27.31102.18920201015986.22.99108.22年平均增长率:G=8.49 04%o(2)C021=1083295.3o24/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现1e6 国内生产总值一元线性回归预测1.1 1.0-0.9-Q8-Q.7-Q6-Q5-2011 2014 2017 2020年份(3)残差图如下:国内生产总值一元线性回归预测的残差图20000-10000-I 0-10000-20000-30000-2011 2014 2017 2020时间7.3(1)二阶曲线和三阶曲线及其预测结果如下:二阶曲线:Y=34.69 52-0.1661t+0.0031t2三阶曲线:Y=33,8 69 8+0.09 11t-0.0146/+0.0003t3o25/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现预测值和预测误差如下:时间1收盘价33.82二阶曲线二阶曲线三阶曲线三阶曲线预测值 34.532237预测残差-0.712237预测值 33.946757预测残差-0.126757233.6434.375366-0.73536633.996526-0.356526334.0034.224616-0.22461634.021107-0.021107434.0934.0799860.01001434.0224560.067544534.2733.9414770.32852334.0025300.267470634.2733.8090890.46091133.9632860.306714734.0033.6828220.31717833.9 0668 10.093319833.8233.5626750.25732533.834672-0.014672933.9133.4486490.46135133.7492160.1607841033.8233.3407430.47925733.6522680.1677321133.5533.2389590.31104133.5457870.0042131233.3633.1432950.21670533.431729-0.0717291333.3633.0537510.30624933.3120510.0479 491433.1832.9703290.20967133.188709-0.0087091533.0032.89 30270.10697333.063661-0.0636611632.6432.821845-0.18184532.938863-0.2988631732.5532.756785-0.20678532.816272-0.2662721832.6432.697845-0.05784532.697845-0.0578451932.7332.6450260.08497432.5855380.1444622032.4532.59 8327-0.14832732.481310-0.0313102132.3632.557749-0.19774932.387115-0.0271152232.0032.523292-0.52329232.3049 11-0.3049 112331.6432.494956-0.8549 5632.236656-0.5966562432.0932.472740-0.38274032.184305-0.0943052532.3632.456645-0.09664532.1498160.2101842632.3632.446670-0.08667032.1351450.2248 552732.3632.442817-0.08281732.1422500.2177502832.6432.4450840.19491632.1730860.4669 142932.7332.4534710.27652932.2296120.5003883032.4532.467980-0.0179 8032.3137830.1362173132.4532.488609-0.03860932.4275560.0224443232.2732.515359-0.24535932.572889-0.3028893332.3632.548229-0.18822932.751738-0.3917383433.0032.5872200.41278032.9660600.0339 403533.1832.6323320.54766833.217811-0.03781136NaN32.683565NaN33.50895NaN预测图如下图所示:26/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现二阶曲线和三阶曲线预测残差图如下:二阶曲线和三阶曲线预测残差 二阶曲埃颈期残差.三鼾曲改预测残差1 4 7 10 13 16 19 22 25 28 31 34时间从不同趋势方程的预测图和残差图均也可以看出,三阶曲线与原序列的拟合最好。27/27- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据分析基础Python实现 数据 分析 基础 Python 实现 各章 习题 答案
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文