东北财经大学《432统计学》[专业硕士]历年考研真题及详解(含复试历年真题).pdf
《东北财经大学《432统计学》[专业硕士]历年考研真题及详解(含复试历年真题).pdf》由会员分享,可在线阅读,更多相关《东北财经大学《432统计学》[专业硕士]历年考研真题及详解(含复试历年真题).pdf(166页珍藏版)》请在咨信网上搜索。
目录第一部分初试历年真题及详解2011年东北财经大学统计学院432统计学专业硕士考研真题2011年东北财经大学统计学院432统计学专业硕士考研真题及详解2012年东北财经大学统计学院432统计学专业硕士考研真题2012年东北财经大学统计学院432统计学专业硕士考研真题及详解2013年东北财经大学统计学院432统计学专业硕士考研真题2013年东北财经大学统计学院432统计学专业硕士考研真题及详解2014年东北财经大学统计学院432统计学专业硕士考研真题2014年东北财经大学统计学院432统计学专业硕士考研真题及详解2015年东北财经大学统计学院432统计学专业硕士考研真题(回忆版)2015年东北财经大学统计学院432统计学专业硕士考研真题(回忆版)及详解2016年东北财经大学统计学院432统计学专业硕士考研真题(完整手抄版)2016年东北财经大学统计学院432统计学专业硕士考研真题(完整手抄版)及详解2017年东北财经大学432统计学专业硕士考研真题2017年东北财经大学432统计学专业硕士考研真题及详解第二部分复试历年真题2014年东北财经大学统计学院应用统计硕士复试真题(回忆版)2015年东北财经大学统计学院应用统计硕士复试真题(回忆版)2016年东北财经大学统计学院应用统计硕士复试真题第一部分初试历年真题及详解2011年东北财经大学统计学院432统计学专业硕士考研真题2011年东北财经大学统计学院432统计学专业硕士考研真题及详解一、概念(举例解释下列概念)(20分)1总体答:总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每个元素称为个体。比如,要检验一批灯泡的使用寿命,这批灯泡构成的集合就是总体,每个灯泡就是一个个体。2样本答:样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。比如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,100就是这个样本的样本量。3参数答:参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。4统计量答:统计量(statistic)是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等。二、选择(在下列各题中选择出一个或一个以上的正确选项)(16分)1按照所采用的计量尺度不同,可以将统计数据分为()。A分类数据B顺序数据C截面数据D数值型数据ABD【答案】按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据表现为类别,但不区分顺序,是由定类尺度计量形成的;顺序数据表现为类别,但有顺序,是由定序尺度计量形成的;数值型数据表现为数值,是由定距尺度和定比尺度计量形成的,也可称为定量数据。【解析】2下列哪些图形不适用于品质型数据的频数分布显示()。A条形图B直方图C茎叶图D箱线图BCD【答案】品质型数据的图示方法包括条形图、帕累托图、饼图、环形图等;顺序数据的图示方法包括条形图、帕累托图、饼图、环形图、累积分布图等;数值型数据的图示方法包括条形图、帕累托图、饼图、环形图、累积分布图、直方图、茎叶图、箱线图、线图、散点图、气泡图、雷达图等。【解析】3描述数据频数分布集中趋势的统计量有()。A方差B众数C中位数D平均数BCD【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量有众数、中位数、分位数、平均数等。方差是描述数据离散程度的统计量。【解析】4时间序列中的观察值可分解为哪几个构成要素()。A长期趋势B季节波动C循环波动D不规则波动ABCD【答案】时间序列是同一现象在不同时间上的相继观察值排列而成的序列。时间序列的成分可以分为四种,即趋势、季节性或季节波动、周期性或循环波动、随机性或不规则波动。趋势也称为长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动;季节变动是指时间序列在一年内重复出现的周期性波动;周期性波动或循环波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。周期性通常是由于经济环境的变化而引起的;随机性或不规则波动是由于一些偶然性的因素产生的。【解析】5假设检验中的两类错误指的是()。A登记错误B测量错误C拒真错误D采伪错误CD【答案】假设检验所犯的错误有两种类型,一类错误是原假设H0为真却被拒绝了,犯这种错误的概率用表示,所以也称错误或弃真错误;另一类错误是原假设为伪却没有被拒绝,犯这种错误的概率用表示,所以也称错误或取伪错误。【解析】6哪种频数分布状态下平均数、众数和中位数是相等的()。A对称的钟形分布B左偏的钟形分布C右偏的钟形分布DU形分布A【答案】在频数对称且单峰分布的状态下,平均数、众数、中位数相等。【解析】7参数估计中评价估计量的三个标准是()。A无偏性B有效性C对称性D一致性ABD【答案】统计学家给出的评价估计量的标准主要有三个:无偏性、有效性、一致性。无偏性是指如果对同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数;有效性是指由于估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就是方差,方差越小,估计量对总体的估计也就越准确,该估计量也就越有效;一致性是指当样本量逐渐增加时,样本的估计量(统计量)能够逐渐逼近总体参数。【解析】8在进行参数估计之前,首先应该确定一个适当的样本容量,决定样本容量大小的因素包括()。A置信水平B边际误差C总体方差D分布类型ABC【答案】决定样本容量大小的因素有以下三点:(1)受总体方差数值大小的影响。总体方差大,抽样误差大,则样本容量应大一些,反之,则可少抽取一些;(2)可靠性程度的高低。可靠性越高,所需的样本容量就越大;(3)允许误差的大小。若要求推断比较精确,允许误差应该低一些,随之抽取的样本容量则多一些;反之,样本容量可少一些。【解析】三、简答(15分)1造成统计数据误差的原因有哪些?如何减少和控制统计数据中的误差?答:统计数据的误差是指通过调查搜集到的数据与研究对象真实结果之间的差异。数据的误差有两类:抽样误差和非抽样误差,其造成原因及减少和控制方法如下:抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差,是由抽样的随机性导致的。通过增加样本量可以减小抽样误差,当样本量大到与总体单位相同时,也就是抽样调查变成普查时,抽样误差就减小到零。非抽样误差是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。非抽样误差包括抽样框误差、回答误差、无回答误差、调查员误差、测量误差等。非抽样误差控制的重要方面是调查过程的质量控制。这包括调查员的挑选、调查员的培训、督导员的调查专业水平、对调查过程进行控制的具体措施、对调查结果进行检验评估、对现场调查人员进行奖惩的制度等。2比较众数、中位数和平均数的异同之处。答:众数是一组数据中出现次数最多的变量值;中位数是一组数据排序后处于中间位置上的变量值;平均数是一组数据相加后除以数据的个数得到的结果。三者的联系表现为:众数、中位数和平均数都是反映数据集中趋势的测度值,当数据的分布对称时,众数、中位数和平均数相等。三者的区别表现为:众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不惟一性,一组数据可能有一个众数,也可能有多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。3从总体中抽取样本,主要有哪些抽样方法?各种抽样方法的特点及适用场合是什么?答:从总体中抽取样本的方式分为两类:概率抽样和非概率抽样。概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。经常采用的概率抽样有简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样主要有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等。概率抽样是依据随机原则抽选样本,样本统计量的理论分布是存在的,若调查的结果要求对总体的有关参数进行估计,并对估计的精度提出了要求,这时应选取概率抽样,如调查不同年龄层段的消费水平等。非概率抽样的特点是操作简单、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试,如产品包装测试、广告测试等,这时不需要将调查结果投影到总体的情况。四、论述(24分)1系统论述统计活动的基本程序、统计方法的构成内容及应用范围。答:(1)统计活动的基本程序包括:统计设计、统计调查、统计整理、统计资料的表现形式、统计分析。统计设计是统计工作的初始阶段,即统计工作实际进行之前的准备阶段,是根据统计研究的目的,对统计工作各个环节的统筹考虑和安排。统计调查就是按照统计设计和调查方案,有计划、有组织地向调查单位搜集统计资料的工作过程。统计整理,是指根据统计研究目的,将统计调查所取得原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。统计资料通过整理,最后以指标及指标体系、统计表和统计图等形式表现出来。统计分析是指根据研究的目的,运用统计方法,以统计资料为依据,结合具体情况,对客观事物进行科学的分析,揭示其本质和规律性,提出解决问题和矛盾的方法的一种活动。(2)统计方法可分为描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。主要包括数据的频数分析、集中趋势分析、离散程度分析、数据的分布及一些基本的统计图形。推断统计是研究如何利用样本数据来推断总体特征的统计方法。该方法是以概率形式来决断数据之间是否存在某种关系,包括总体参数估计和假设检验,常用方法有Z检验、T检验、卡方检验等。描述统计和推断统计二者彼此联系,相辅相成,描述统计是推断统计的基础,推断统计是描述统计的升华。具体研究中,是采用描述统计还是推断统计,应视具体的研究目的而定,如研究的目的是要描述数据的特征,则需描述统计;若还需对多组数据进行比较或需以样本信息来推断总体的情况,则需用推断统计。例如,在教育领域中,在对某幼儿园大班开展一项识字教改实验,期末进行一次测试,并对测试所得数据进行统计分析。如果只需了解该班儿童识字的成绩(平均数及标准差)及其分布,此时,应采用描述统计方法;若还需进一步了解该实验班与另一对照班(未进行教改实验)儿童的识字成绩有无差异,从而判断教改实验是否有效时,除了要对两个班的成绩进行描述统计之外,还需采用推断统计方法。五、计算1一项调查获如下容量为20的样本数据:(15分)要求:(1)确定该数据的中位数(2)以04、59、1014等为组限,绘制等距式频数分布表及累积频数分布表。(3)绘制频数分布直方图和累积频数分布图。(4)指出该数据所属的频数分布类型。解:(1)将数据按照升序重新排序,结果如下:中位数位置(201)/210.5所以中位数为:(88)/28,即m0.58。(2)等距式频数分布表(3)频数分布直方图如下:频数分布直方图累计频数分布图如下:向上累积频数分布图向下累积频数分布图(4)把数据代入公式可得:SK0.796说明该频数分布中等右偏,K0.081说明该频数分布为尖峰分布,即与正态分布相比,该数据分布更集中。2下面是两个变量的5次观察值:(10分)要求:(1)就上述数据绘制散点图。(2)观察散点图,指出x与y之间存在何种可能的关系?(3)计算相关系数并解释其计算结果的含义。解:(1)(2)观察散点图可知,x与y之间可能存在线性相关关系。(3)相关系数0.5r0.8,说明x与y之间存在中度正相关的线性关系。3甲乙两个班级统计学考试成绩资料如下:(15分)甲班的平均分数为75分,标准差为7分;乙班的考试成绩频数分布表如下:要求:(1)计算乙班的平均考试分数。(2)计算乙班考试分数的方差及标准差。(3)计算乙班考试分数的离散系数。(4)比较甲乙两个班级考试分数的离散程度的大小。解:(1)乙班平均考试分数计算过程如下表所示:乙班平均考试分数的分组数据表由上表中数据可得(2)方差计算过程如下表所示:由上表中数据可得:(3)(4),说明两个班的统计学考试成绩相比较,甲班的成绩较集中,乙班的成绩较分散。4从一个标准差为6的总体中,随机抽取了一个容量为45的样本,并计算得样本均值为30。试以95%的置信度给出总体均值的置信区间(Z0.0251.96)。(5分)解:由题意可知,x30,6,n45,参数估计使用z统计量,所以总体均值的置信区间为:即(28.247,31.753)。5某城市某种工业产品产量资料如下表所示:(15分)要求:(1)绘制时间序列动态图(2)计算该城市该种工业产品产量各年的环比增长率和定基增长率。(3)计算该城市该种工业产品产量从2005年到2009年4年间的平均增长率。(4)运用最小二乘法确定趋势直线方程ytb0b1t。解:(1)绘制的时间序列动态图如下:工业产品产量序列动态图(2)计算该城市该种工业产品产量各年的环比增长率和定基增长率的过程如下表所示:(3)该城市该种工业产品产量从2005年到2009年4年间的平均增长率为(4)根据最小二乘法求解b0和b1的公式,得所以yt26513.913.9t。6两种商品基期和报告期的销售量及销售价格数据如下表所示:(15分)要求:(1)计算两种商品的拉氏价格指数。(2)计算两种商品的帕氏价格指数。(3)比较拉氏价格指数与帕氏价格指数计算结果的差异,并指出产生差异的原因。解:(1)两种商品的拉氏价格指数为:(2)两种商品的帕氏价格指数为:(3)比较(1)和(2)的计算结果可知,拉氏价格指数与帕氏价格指数计算结果不同,产生差异的原因是权数确定的时期不同:拉氏价格指数将权数的同度量因素固定在基期;帕氏价格指数将权数的同度量因素固定在报告期。2012年东北财经大学统计学院432统计学专业硕士考研真题2012年东北财经大学统计学院432统计学专业硕士考研真题及详解一、选择(40分)1对于(缺数据)一个由12名学生构成的样本,询问他们钱包里有多少零花钱,他们的回答如下(元):(1)这些数据的均值为()A60.05B49.80C60.00D44.08(2)这些数据的中位数为()A45.00B40.00C104.00D60.00(3)这些数据的众数为()A104.00B44.00C5.00D40.00略【答案】2统计学期中考试非常简单,为了评估简单程度,教师记录了9名学生交上考试试卷的时间如下(分钟):(1)这些数据的极差为()A3.00B3.00C41.00D41.00C【答案】数据按从小到大排序结果如下:【解析】极差最大值最小值601941。(2)这些数据的除以样本自由度的方差为()A150.00B150.00C260.00D260.00A【答案】设样本方差为S2,根据未分组数据和分组数据计算样本方差的公式分别为:【解析】未分组数据:分组数据:本题为未分组数据,代入公式即得答案A。(3)这些数据的除以样本自由度的标准差为()A29.60B12.25C12.25D29.60B【答案】标准差是方差的算术平方根。【解析】(4)这些数据的离散系数为()A3.81B0.31C3.81D0.31D【答案】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其计算公式为:【解析】VSS/x12.25/39.330.313汽车销售人员每年销售的汽车数量是服从正态分布的,标准差是15,抽取400名销售员组成的随机样本,发现每年平均销售量是75辆。(1)总体均值的置信度为95%(Z0.0251.96)的估计区间为()A(74.93,75.07)B(73.53,76.47)C(76.47,73.53)D(75.07,74.93)B【答案】在大样本条件下,总体服从正态分布,总体均值在置信水平下的置信区间可以写为:【解析】即得答案为B项。(2)总体均值的置信度为95.45%(Z0.022752.00)的估计区间为()A(74.25,75.75)B(75.75,74.25)C(73.50,76.50)D(76.50,73.50)C【答案】按照上题解析中的公式,代入数据即得答案为C项。【解析】(3)欲在缩小估计区间宽度的同时,提高置信度,惟一途径为()A以样本标准差替代总体标准差B减少样本容量C以样本中位数替代样本均值D增加样本容量D【答案】由(1)题解析中的公式可知,要提高置信度,只能扩大区间宽度,或者增加样本容量,故本题答案是D项。【解析】二、简答(50分)1统计中用以描述数据频数分布集中趋势的统计量主要有哪些?各自有何特点?(10分)答:(1)集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量主要有两大类:一类是数值平均数,它们是根据全部数据计算得到的代表值,主要包括算数平均数、调和平均数及几何平均数。算术平均数也称为均值,是一组数据相加后除以数据的个数得到的结果,包括简单算数平均数和加权算数平均数。算术平均数是对数值型数据计算的,而且利用了全部数据信息,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,代表性较差。调和平均数也称为倒数平均数,是总体各单位标志值倒数的算术平均数的倒数。社会经济统计中使用的调和平均数往往具有特定(经济)意义,通常是加权算术平均数的变形。主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的实际问题。几何平均数。几何平均数是指n个观察值连乘积的n次方根。计算几何平均数要求各观察值之间存在连乘积关系,主要适用于对比率、指数等进行平均,计算平均发展速度等。(2)另一类是位置代表值,是根据数据所处位置直接观测或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数等。众数(mode)是一组数据中出现次数最多的变量值,用Mo表示。众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不惟一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。中位数(median)是一组数据排序后处于中间位置上的变量值,用Me表示。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。2总体与样本的联系与区别是什么?总体参数与样本统计量有何异同之处?(10分)答:(1)总体与样本的含义 总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。样本(sample)是从总体中抽取的一部分单位,作为总体的代表加以研究,样本所包含的总体单位数称为样本容量(sample size)。样本来自于总体,可以根据样本提供的信息推断总体的特征。参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。统计量(statistic)是用来描述样本特征的概括性数字度量。(2)总体参数与样本统计量的异同区别:总体参数是总体指标的统称,从总体中计算得到,代表总体特征,由于总体数据通常未知,所以总体参数是一个未知的常数,但不是变量;样本统计量是根据样本数据计算出来的用于对数据分析检验的一个量,由于抽样是随机的,因此样本统计量是一个变量,是样本的函数。由于样本是已经抽出来的,所以样本统计量总是已知的。此外,总体参数常用希腊字母表示,样本统计量常用英文字母表示。联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,样本统计量与总体参数是同一统计指标;当总体为无限时,样本统计量与总体参数不同,但样本统计量可以在某种程度上作为总体参数的估计值,通过样本统计量,对总体参数作出预测和估计。3统计中用以描述品质型数据频数分布的图形主要有哪些?各自有何特点?(10分)答:品质型数据包括分类数据和顺序数据。描述分类数据频数分布的图形主要有条形图、帕累托图、饼图等;描述顺序数据频数的图形除了以上几种,还有累积频数分布图。条形图(bar chart)是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,纵置时也称为柱形图(column chart)。此外,条形图有简单条形图、对比条形图等形式。帕累托图(Pareto chart)是按各类别数据出现的频数多少排序后绘制的柱形图。通过对柱形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。帕累托图在质量控制研究中有广泛应用。对于不同类型的缺陷、失效方式和其他感兴趣的类,可以用帕累托图观察各个类的影响顺序。饼图(pie chart)是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。对于顺序数据,还可以计算累积频数和累积频率(百分比)。根据累积频数或累积频率,可以绘制累积频数分布或频率图。4什么叫P值?P值在假设检验的决策过程中有何作用?(10分)答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P值越小,我们拒绝原假设的理由就越充分。利用P值,我们可以精确地反映决策的风险度,按照我们所需要的显著性水平进行判断和决策。具体做法就是用P值和事先确定的显著性水平进行比较,一般地,用X表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:左侧检验的P值为检验统计量X小于样本统计值C的概率,即PPXC;右侧检验的P值为检验统计量X大于样本统计值C的概率,即PPXC;双侧检验的P值为检验统计量X落在样本统计值C为端点的尾部区域内的概率的2倍:P2PXC或P2PXC。若X服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P值可表示为PPXC。计算出P值后,将给定的显著性水平与P值比较,就可作出检验结论:如果P值,则在显著性水平下拒绝原假设;如果P值,则在显著性水平下接受原假设。在实践中,当P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。5什么是拒真错误?什么是采伪错误?犯拒真错误的概率与犯采伪错误的概率有何联系与区别?(10分)答:(1)定义:拒真错误是假设检验中的第一类错误,是指原假设H0为真却被我们拒绝了,犯这种错误的概率用表示,所以也称错误。采伪错误是假设检验中的第二类错误,是指原假设不正确而接受原假设的错误,犯这种错误的概率用表示,所以也称错误。(2)区别:由部分来推断总体,判断有可能正确,也有可能不正确,错误和错误是假设检验中存在的两类不同的错误。在双侧检验时是两个尾部的拒绝域面积之和,在单侧检验时是单侧拒绝域的面积。只取单尾,假设检验时值一般不知道,在一定情况下可以测算出,如已知两总体的差值、样本含量和检验显著性水平。由于检验统计量是随机变量,有一定的波动性,有时原假设H0并不正确,在正常的情况下,计算的统计量仍有一定的概率落入接受域内,从而错误地接受了原假设H0。是限制犯第二类错误的保证,又称为检验的污染。根据不同的检验问题,对于与大小的选择有不同的考虑。(3)联系:在样本容量不变的条件下,犯错误的概率与犯错误的概率常常呈现反向的变化,即如果减小犯错误的概率,就会增大犯错误的机会;若减小犯错误的概率,就会增大犯错误的机会。要使犯错误的概率与犯错误的概率同时变小,只有增大样本量。但样本量不可能没有限制,否则就会使抽样调查失去意义,因此,在假设检验中,就有一个对两类错误进行控制的问题。一般来说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。在假设检验中,通常首先控制犯错误,这样做最主要的原因是,从实用的观点看,原假设是什么常常是明确的,而备择假设是什么则常常是模糊的。三、计算(60分)1某班学生统计学期末考试成绩数据如下表所示:(20分)某班学生统计学期末考试成绩频数分布表要求:(1)绘制频数分布直方图;(2)填制累积频数分布表;(3)绘制累积频数分布图;(4)计算均值、方差及标准差。解:(1)绘制频数分布直方图如下:某班学生统计学期末考试成绩频数分布图(2)完整的累积频数分布表如下:某班学生统计学期末考试成绩频数分布表(3)累积频数分布图如下:某班学生统计学期末考试成绩向上累积频数分布图某班学生统计学期末考试成绩向下累积频数分布图(4)均值计算过程如下:由上表及均值计算公式可得:方差计算过程如下:由方差计算公式可得:标准差2下面是一个单因素方差分析表,请填充表中空格。(10分)单因素方差分析表解:由方差分析恒等式:总变差平方和组间变差平方和组内变差平方和可知:组间差异总差异组内差异564495.7357512.23506983.50组间差异自由度59257组内差异的均方差异(组内方案)57512.23/228756.12组间差异的均方差异(组间方案)506983.50/578894.45F组间方差/组内方差8894.45/28756.120.31填充完整的单因素方差分析表如下:单因素方差分析表3某生产线生产出的零件尺寸服从正态分布,其标准规格为6mm。为检验生产线工作状态是否正常,随机抽取了一个容量为10的样本,算得样本均值为6.4mm,样本方差为0.09。要求:以0.05的显著性水平检验生产线状态正常的假设t0.025(9)2.262。(10分)解:由于零件尺寸服从正态分布,总体方差未知,且样本量较小,所以应采用t统计量。已知条件为:06,x6.4,s20.09,n10,0.05建立假设检验,设:H0:6H1:6当0.05,自由度n19时,由题干可知t/2(9)2.262。因为tt/2,样本统计量落入拒绝域,故拒绝H0,接受H1,说明0.05的显著性水平下,生产线工作状态不正常。5两种商品基期和报告期的销售量及销售价格数据如下表所示:(20分)要求:(1)计算两种商品的拉氏价格总指数;(2)计算两种商品的帕氏价格总指数;(3)比较拉氏价格总指数与帕氏价格总指数计算结果的差异,并指出产生差异的原因;(4)计算两种商品的价格理想指数。解:(1)两种商品的拉氏价格总指数为:(2)两种商品的帕氏价格总指数为:(3)产生差异的原因:权数确定的时期不同:拉氏价格指数将权数的同度量因素固定在基期;帕氏价格指数将权数的同度量因素固定在报告期。拉氏指数与帕氏指数的同度量因素水平和计算结果的差异,表明它们具有不完全相同的经济分析意义。以价格指数为例,拉氏价格指数以基期商品销售量作为同度量因素,这说明它是在基期的销售数量和销售结构的基础上来考察各种商品价格的综合变动程度的;而帕氏价格指数以报告期商品销售量作为同度量因素,则说明它是在报告期的销售数量和销售结构的基础上来考察各种商品价格的综合变动程度的。尽管两者的基本作用都是反映价格水平的综合变动,但怎样反映、在什么基础上反映,两者又是存在差别的。相比之下,帕氏指数立足于报告期,其分析更具现实性。(4)理想价格指数,是指美国著名统计学家费希尔于1927年在其名著统计指数的编制中提出的主张:取拉氏指数和帕氏指数的几何平均数的一种物价指数。计算两种商品的价格理想指数Kp,可得:2013年东北财经大学统计学院432统计学专业硕士考研真题2013年东北财经大学统计学院432统计学专业硕士考研真题及详解一、单项选择(20分)1下列哪一种频数分布状态下,均值、众数、中位数三者必然相等()。AU形分布B左偏钟形分布C右偏钟形分布D对称钟形分布D【答案】如果数据的分布是对称钟形分布,则有众数(Mo)、中位数(Me)和平均数(x)必定相等,即MoMex;如果数据的分布是左偏钟形分布,则有xMeMo;如果数据的分布是右偏钟形分布,则有MoMex。【解析】2显著性水平下,均值的Z检验中下列哪种情形下拒绝0的原假设()。AZZBZZC|Z|Z/2D|Z|Z/2D【答案】假设检验的决策准则:左单侧检验:若ZZ,拒绝H0;右单侧检验:若ZZ,拒绝H0;双侧检验:若|Z|Z/2,拒绝H0。【解析】3用以描述数据频数分布图形尖削程度的统计量是()。A均值B方差C偏度D峰度D【答案】“偏度”是对数据分布对称性的测度,测度偏度的统计量是偏度系数。“峰度”是对数据分布平峰或尖峰程度的测度,测度峰度的统计量是峰度系数。【解析】4假设检验中同时降低犯拒真错误和采伪错误的惟一途径是()。A修改原假设B修改备择假设C扩大样本容量D提高置信度C【答案】在样本容量不变的条件下,拒真错误即错误与采伪错误即错误常常呈现反向的变化,即如果减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小,只有增大样本量。【解析】5参数估计中,其他条件不变的前提下,置信区间越宽则置信度()。A越低B越高C不变D不确定B【答案】置信区间是指在某一置信度时,总体参数所在的区域距离或区域长度。置信度又称置信水平,是指总体参数值落在样本统计值某一区间内的概率。由此可见,在其他条件不变的前提下,置信区间越宽,置信水平越高,则置信度越高。【解析】6频数分布盒形图中,盒子的宽窄表示()。A离散程度的大小B平均水平的高低C偏态D峰态A【答案】盒形图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。盒子的宽窄表示的是数据分布的离散程度。【解析】7最不受极端值影响的描述性统计量是()。A众数B方差C标准差D均值A【答案】众数是一组数据中出现次数最多的变量值,用Mo表示。众数是一个位置代表值,不受极端值的影响,抗干扰性强。而方差、标准差、均值均利用了全部数据的信息,因此容易受到极端值的影响。【解析】8对总体均值做右侧检验,若检验统计量为Z,显著性水平为,则拒绝原假设决策准则是()。AZZBZZCZZ/2DZZ/2A【答案】假设检验的决策准则:左单侧检验:若ZZ,拒绝H0;右单侧检验:若ZZ,拒绝H0;双侧检验:若|Z|2,拒绝H0。【解析】9拉氏价格综合指数是价格个体指数的()。A简单算术平均数B加权算术平均数C简单几何平均数D加权几何平均数B【答案】拉氏价格综合指数的计算公式为:【解析】其中销售量q是权数,它在计算综合指数时将作为权数的同度量因素固定在基期。10 样本数据中大于下四分位数小于上四分数的观测值的个数占全部观测值个数的()。A25%B40%C50%D75%C【答案】下四分位数是指处在25%位置上的数值,上四分位数是指处在75%位置上的数值。因此样本数据中大于下四分位数小于上四分数的观测值的个数占全部观测值个数的50%。【解析】二、多项选择(15分)1用以描述数据频数分布集中趋势的统计量是()。A众数B均值C中位数D方差E极差ABC【答案】用以描述数据分布集中趋势的统计量主要有:众数、中位数、分位数、平均数等。用以描述数据分布离散程度的统计量主要有:异众比率、极差、平均差、方差和标准差、离散系数等。【解析】2假设检验中的两类错误指的是()。A备择假设错误B原假设错误C拒真错误D采伪错误E统计量错误CD【答案】拒真错误是假设检验中的第一类错误,是指原假设H0为真却被拒绝了,犯这种错误的概率用表示,所以也称错误。采伪错误是假设检验中的第二类错误,是指原假设不正确而接受原假设的错误,犯这种错误的概率用表示,所以也称错误。【解析】3下列变量属于数值型变量的是()。A定类变量B定序变量C定距变量D定比变量E定性变量CD【答案】CD两项,定距变量和定比变量均是区别同一类别个案中等级次序及其距离的变量。定比变量除了具有定距变量加与减的特性外,还具有乘与除的数学特质,二者均属于数值型变量。AB两项,定类变量和定序变量属于定性变量,表现为某事物的属性特征。【解析】4适合于描述品质型变量的频数分布图是()。A直方图B饼形图C盒形图D条形图E茎叶图BD【答案】适合于描述品质型变量的频数分布图有:条形图、帕累托图、饼图和环形图。而直方图、盒形图、茎叶图适合于描述数值型变量的频数分布图。【解析】5抽样推断中,影响样本量大小的因素是()。A总体方差B置信度C极限误差D总体均值E总体偏度ABC【答案】设E表所希望达到的估计误差,则确定样本量的公式为:【解析】据此可知,样本量的大小与置信水平的平方成正比,与总体方差成正比,与估计误差的平方成反比。三、判断题(正确的在括号内划“”,错误的划“”)(15分)1假设检验中,其他条件不变的前提下,降低犯拒真错误的概率,势必增加犯采伪错误的概率。()【答案】假设检验中,在样本容量不变的条件下,拒真错误即错误与采伪错误即错误常常呈现反向的变化,即如果减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小,只有增大样本量。【解析】2左偏钟形分布下,均值、众数、中位数三者必然相等。()【答案】对称钟形分布情况下,均值、众数、中位数三者必然相等。左偏钟形分布下,均值、众数、中位数三者的关系为:均值中位数众数。【解析】3参数估计中,置信度越大则推断结果正确的把握程度越高。()【答案】置信度也称为可靠度,或置信水平、置信系数,表示区间估计的把握程度,置信区间的跨度是置信水平的正相关函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的【解析】准确程度。4盒形图只适用于描述定序数据的频数分布。()【答案】盒形图适用于描述数值型数据的频数分布。并不适用于分类数据和顺序数据。【解析】5简单线性回归分析中,判定系数等于相关系数的平方。()【答案】在简单线性回归中,相关系数r实际上是判定系数的平方根。【解析】四、简答题(50分)1统计中常用的抽样方法有哪些?各自适用于何种情况的抽样?答:统计中常用的抽样方法主要可以分为两类:概率抽样和非概率抽样。(1)概率抽样概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:简单随机抽样简单随机抽样指从包括总体N个单位的抽样框中随机地、一个一个地抽取 个单位作为样本,每个单位入样的概率是相等的。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此之间无一定的关联性和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。分层抽样分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。整群抽样整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考研历年真题
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【雁**】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【雁**】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【雁**】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【雁**】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文