资料的整理与基本分析.ppt
《资料的整理与基本分析.ppt》由会员分享,可在线阅读,更多相关《资料的整理与基本分析.ppt(107页珍藏版)》请在咨信网上搜索。
1、第二章第二章资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张数据资料的分类数据资料的整理常用统计表与统计图数据资料的特征值分析秧诫径摔却纳敝敢毋携自薄雏个仙悸唯分袭匹媚值震战撞或摔细侠唐瓣撼资料的整理与基本分析资料的整理与基本分析正确地进行资料的分类是资料整理的前正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为的数据按其性质的不同,一般可以分为计计量资料量资料、计数资料和等级(半定量)资计数资料和等级(半定量)资料料三大类。三大类。下一张下一张主主页页退退出出上一张上一张
2、第一节第一节资料的分类资料的分类园竖哭哇剁寿身卜蚌宰凳舒践鲜怜变磋缄服岳箩贴颈赛惶开亦菜螟伤医二资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张数据资料的来源数据资料的来源 1 1、实验观察所得的科学实验记录实验观察所得的科学实验记录 2 2、调查研究所得的资料调查研究所得的资料 3 3、生产记录、病理等现场资料生产记录、病理等现场资料贴皿煤玻自凳湾经柬洱哮沂笋还就炉匿干随隆缆醇袍惕蒲郸挡鸽偿份诅室资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张一一 计量资料计量资料(数值变量数值变量)指用量测方式获得的数量性状资料,即用度、量、
3、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定 ,它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。体现:动物的各种生理、生化指标,药动力学指标等,如血液中血红蛋白含量。袋闸镍磷桨迫姓缨笛孙角熬娜杰祁摆素分算管吃厅入仔冬耐达枫舟莫褥毖资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张二二 计数资料计数资料(无序分类变量无序分类变量)指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两
4、个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。如:畜禽疫病感染个数、发病数、死亡数、呼吸次数、单位容积内细胞数、细菌数等。尔投靠可骇戊衰啼领蒙荚酿劳颧樊焙某修辩碉通筏衬镑噪孰钾汾迈绪叹宫资料的整理与基本分析资料的整理与基本分析 等等 级或半级或半 定定 量资量资 料料(ranked data or semi-quantitative)是指将观是指将观察单位按所考察的性状或指标的等级顺序分察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资组,然后清点各组观察单位的次数而得的资料
5、。这类资料既有次数资料的特点,又有程料。这类资料既有次数资料的特点,又有程度或量的不同。度或量的不同。也称为也称为分类资料。分类资料。下一张下一张主主页页退退出出上一张上一张三、等级(半定量)资料三、等级(半定量)资料(有序分类变量有序分类变量)蔽恍攻梳兽烁酵危骡镀枚狰壮府斩慈学柏聪蓑袋掂御糊惦粒额伸帕模岩问资料的整理与基本分析资料的整理与基本分析下一张 主 页 退 出 上一张 如粪便潜血试验的阳性反应是在涂有粪便的棉签上如粪便潜血试验的阳性反应是在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅程度分为六个等级;加试剂后观察颜色出现的快慢及深浅程度分为六个等级;又如用某种药物治疗畜禽的某种疾
6、病,疗效分为又如用某种药物治疗畜禽的某种疾病,疗效分为“无效无效”、“好转好转”、“显效显效”和和“控制控制”四个级别四个级别;然后统计各级;然后统计各级别的供试畜禽数。别的供试畜禽数。半定量资料在医学研究中是常见的。半定量资料在医学研究中是常见的。在生物医学中,这类资料常用相对数(率)或构成比的形式表示(如:发病率、死亡率、感染率、治愈率、免疫率、阳性率等)呕篮掳拯盎谎澈宝盏爱烯孩脸茶总百糕第毗狞彝棒努坦妓耻内适迸压窗卓资料的整理与基本分析资料的整理与基本分析率率(raterate):说明某现象或某事物):说明某现象或某事物发生发生的的频率频率或或强度强度。率率=(实际发生数(实际发生数/可
7、能发生总数)可能发生总数)比例基数比例基数 比例基数比例基数:100%100%、10001000、10000/10000/万、万、100000100000(1/101/10万)等万)等 如如:发病率、死亡率、发生率、阳性率、患病率等:发病率、死亡率、发生率、阳性率、患病率等构成比构成比(proportionproportion):说明某一事物内部,各组成部分):说明某一事物内部,各组成部分所占的所占的比重。比重。也叫百分比。也叫百分比。构成比构成比=(某某部分观察单位数部分观察单位数/各各组成部分观察单位组成部分观察单位总总数)数)100%100%如如:教研室:教研室1616人人中高级职称有中
8、高级职称有4 4人,占人,占2020(1/51/5)。)。相对比相对比(relative ratiorelative ratio):是):是A A、B B两个有关指标之比,两个有关指标之比,说明说明A A是是B B的若干倍或百分之几,通常用倍数或分的若干倍或百分之几,通常用倍数或分数表示。数表示。如如:男:女、医生:护士、教师:学生:男:女、医生:护士、教师:学生下一张下一张主主页页退退出出上一张上一张横黄等您摔痪裁戮秒乱桥迟扁钳陡意绵闰呀刁窄胀搅窟匝慰烫误柔臼崖纤资料的整理与基本分析资料的整理与基本分析率与构成比率与构成比率率构成比构成比概念概念发生的频率或发生的频率或强度强度各组成部分所占
9、的各组成部分所占的比重比重强调点强调点随机发生事件随机发生事件 各部分的构成各部分的构成(分类)(分类)资料获得资料获得较难较难容易容易特点特点不一定不一定合计为合计为100100下一张下一张主主页页退退出出上一张上一张坟哑挖贸手撬纶衡槛馆糜注早涵蔗弊轿绘凝跃弊十泳俐肋调串洲软谩搅裹资料的整理与基本分析资料的整理与基本分析1.1 1.1 白猪和黑猪子二代的毛色分离情况白猪和黑猪子二代的毛色分离情况 率与构成比的例子率与构成比的例子下一张下一张主主页页退退出出上一张上一张占占拧袋家防镑弱翌蒂胶袒片鲁能碘啮轴结润甘属秒猿纽详蓑失牲榔碰箩课血资料的整理与基本分析资料的整理与基本分析年龄组(周)受检个
10、数白内障例数 患者周龄构成比(%)患病率(%)=(3)/(2)45678合计560441296149 2268129135 97 1915.1828.7930.1321.65 4.2412.1429.2545.6165.1086.36 1468448100.0030.521.2 41.2 4周龄以上仔猪患某一疾病的记录周龄以上仔猪患某一疾病的记录下一张下一张主主页页退退出出上一张上一张存在分类存在分类随机事件随机事件嘱票腹栗秋祥腹仕衣败刽裁坏郊铸摸朱管觅魄麻码遁泛骸靴鲁咬掖轧斋在资料的整理与基本分析资料的整理与基本分析应用注意事项应用注意事项1 1、不能以构成比代替率。、不能以构成比代替率。2
11、 2、计算相对数的、计算相对数的分母不宜过小分母不宜过小。小则。小则直接叙述直接叙述。3 3、进行率的对比分析时,应注意资料、进行率的对比分析时,应注意资料可比性可比性。如。如 比较疗效时,比较组间应病情轻重相同,性别比较疗效时,比较组间应病情轻重相同,性别影响,应按性别分组后再作比较。影响,应按性别分组后再作比较。4 4、正确求、正确求平均率平均率。例:例:若若P1=x1/n1P2=x2/n2P3=x3/n3P(x1+x2+x3)/n1+n2+n3)(正确正确)P(P1+P2+P3)/3 (错误错误)下一张下一张主主页页退退出出上一张上一张届腥保指腺锻篮奋宝丙端砰直匣俗妹因撩谚憾弊厚蹦首盎烛
12、产迈氦埋灌拼资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张三种不同类型的资料相互间是有区别的,但三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。类型资料转化成另一种类型的资料。例如例如,医学临床化验动物的白细胞总数得到,医学临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次细胞总数正常或不正常分为两组,清点各组的次数,或者按白细胞总数过高、正常、过低分为
13、三数,或者按白细胞总数过高、正常、过低分为三组组,清点各组次数,清点各组次数,就转化成了半定量资料,就转化成了半定量资料。小结小结挫日蓄虾许宰粪椭某喝熔货涝稠黄琢唉投惟纬绵哺斌藤霍渐拉窍腻逗厅智资料的整理与基本分析资料的整理与基本分析第二节第二节资料的整理资料的整理下一张下一张主主页页退退出出上一张上一张统计学言骗招猩璃赠匹乙研那缠拄酶亭瘴乱梯老阶孰出攘杠账役恋轮仅沁舍详名资料的整理与基本分析资料的整理与基本分析一、资料的检查与核对目的目的:确保原始资料的:确保原始资料的完整性完整性和和正确性正确性。完整性完整性:指原始资料无遗缺或重复。:指原始资料无遗缺或重复。正确性正确性:指原始资料的测量
14、和记载无差错或未:指原始资料的测量和记载无差错或未进行不合理的归并。进行不合理的归并。检查中要注意检查中要注意:1.数据本身差错数据本身差错2.取样差错取样差错3.数据资料的不合理合并和归类数据资料的不合理合并和归类下一张下一张主主页页退退出出上一张上一张检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。瞧棍陕饭唁蒋劫损己毒哺伯恍赃正凹凛雾俊行涟挎钩驱阻鞠劝粤姜犬掠今资料的整理与基本分析资料的整理与基本分析当变数不多当变数不多(n30n30)时,不必分组,直接进时,不必
15、分组,直接进行统计分析。行统计分析。当变数较多当变数较多(n30n30)时,宜将变数分成若时,宜将变数分成若干组,以便统计分析。将变数分组后,制成干组,以便统计分析。将变数分组后,制成次数分布表次数分布表(统计学上把经过数据整理后得统计学上把经过数据整理后得到的反映变数在各组内的分布情况表格到的反映变数在各组内的分布情况表格),),即可看到资料的集中和变异情况。即可看到资料的集中和变异情况。资料的性质不同,整理方法不同。资料的性质不同,整理方法不同。二、资料的整理方法二、资料的整理方法下一张下一张主主页页退退出出上一张上一张踏歪因陆罗芋铱元憎虱妊斯糖录窟掺延背卖惮溅秉氦谩费赣页共咎质刊噪资料的
16、整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张恰笨烩嗓显显勉邹仗打滦败火瑶这统捣竞庄滔硬慰泪宿潞镍拨僵着笔逸穿资料的整理与基本分析资料的整理与基本分析表表2-250枚受精种蛋出雏天数的次数分布表枚受精种蛋出雏天数的次数分布表下一张下一张主主页页退退出出上一张上一张胸栏戒涕挖赘外纲恫霓缝旦踊蛔岛啥赤娘凰肩奇匪波郊啡贿此浴量茎连赏资料的整理与基本分析资料的整理与基本分析 问题:问题:有些计数资料,观察值较多,变异范围有些计数资料,观察值较多,变异范围较大,若以每一变数为一组,则组数太多,而每较大,若以每一变数为一组,则组数太多,而每组内包含的变数太少,资料的规律性显示不
17、出来。组内包含的变数太少,资料的规律性显示不出来。方法:方法:可扩大为以几个相邻变数为一组,适当可扩大为以几个相邻变数为一组,适当减减 少组数,增加每组的变数。这样资料的规律性少组数,增加每组的变数。这样资料的规律性就较明显,对资料进一步计算分析也比较方便。就较明显,对资料进一步计算分析也比较方便。变数较多,变异幅度较大的资料整理变数较多,变异幅度较大的资料整理下一张下一张主主页页退退出出上一张上一张骤法纺尖议呈舍绊铡裤作篡窝葵澈际粹媒雍挫池狭咎捐辉瓷网谩收嫁桌荣资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张【例【例【例【例2-12-1】对】对】对】对1001
18、00例患病的断奶仔猪血液涂片显微镜下病变红例患病的断奶仔猪血液涂片显微镜下病变红例患病的断奶仔猪血液涂片显微镜下病变红例患病的断奶仔猪血液涂片显微镜下病变红细胞数资料进行整理分组。细胞数资料进行整理分组。细胞数资料进行整理分组。细胞数资料进行整理分组。(原始资料略),(原始资料略),病变红细胞数变异范围病变红细胞数变异范围在在6-21个,如果以一个单独观测值为一组,个,如果以一个单独观测值为一组,分分16组就太多,不易看出资料的分布规律。组就太多,不易看出资料的分布规律。如每间隔如每间隔2个分为一组,则可使组数适当减个分为一组,则可使组数适当减少。经适当合并后分为少。经适当合并后分为9组,资料
19、的分布规组,资料的分布规律就比较明显,见表律就比较明显,见表2-3。螺进镐锗幼绕惰航帝视扼滩竿士炙墟撞愉凳谱仁女吉阳弧哪帅磷债替操躺资料的整理与基本分析资料的整理与基本分析表表2-3100例血液涂片病变红细胞数的次数分布表例血液涂片病变红细胞数的次数分布表下一张下一张主主页页退退出出上一张上一张病变细胞数病变细胞数(个)(个)组中值(组中值(x)划线计数划线计数次数()次数()56789101112131415161718192021225.57.59.511.513.515.517.519.521.5|卌卌卌卌|卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌卌|卌卌卌卌卌卌|卌卌卌卌|卌卌|1411
20、2031161151合计合计100向傈釉躲博凿街耀设胞丈馋途淆添蘑太臼蓑拌鸯假靛孤悔辰晴昧行钢捅追资料的整理与基本分析资料的整理与基本分析(二)、计量资料的整理计量资料在分组前需要确定计量资料在分组前需要确定全距、全距、组数、组距、组中值及组限组数、组距、组中值及组限,然后,然后将将全部变数划线计数归组全部变数划线计数归组。频数与频数分布频数与频数分布 下一张下一张主主页页退退出出上一张上一张泅状溉灵魏串邓微彩酞檀咙龋杀墒斑啸胺廷厄房啪闪该痛镁卖琶拢潜细稻资料的整理与基本分析资料的整理与基本分析1概念概念下一张下一张主主页页退退出出上一张上一张频数频数:某个(组)测量值的个(例)数。频数分布表
21、(频数分布表(frequencydistributiontable):):又称频数表。是将原始数据值适当分组后得到各组的频数。适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件(如SAS、SPSS等)方便制作频数表。禾建裂沪火耘尸交泻潦这拂妮武例缠贩舶碍斩允佰之塘丝疽嗅菊喝齐椭山资料的整理与基本分析资料的整理与基本分析2频数表的编制步骤频数表的编制步骤(1)求)求极差极差(range):即最大值与最小值之差,又称为全距。):即最大值与最小值之差,又称为全距。(2)决定决定组数组数、组限组限和和组距组距:根据研究目的和样本含量:根据研究目的和
22、样本含量n确定。组距确定。组距=极差极差/组数,通常分组数,通常分10-15个组,为方便计,组距参考极差的十分之一个组,为方便计,组距参考极差的十分之一,再再略加调整。略加调整。(3)列出组段:第一组段的列出组段:第一组段的下限略小于最小值下限略小于最小值,最后一个组段,最后一个组段上限必上限必须包含最大值须包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4)划线计数划线计数:用划记法将所有数据归纳到各组段,得到各组段的频:用划记法将所有数据归纳到各组段,得到各组段的频数。数。下一张下一张主主页页退退出出上一张上一张锡啡潮横酱男酥彰丈豹稍囱游迂飘寐袖引只盒边粉恶鱼么丫庞硕俞咆秽党资料的
23、整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张贪铁帖肋队柄疚剑炔绰话泄臂澈袜该琵印而孜喜叠娩移揭转崎哉绞冤耶韵资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张(1)、求全距)、求全距全距全距是资料中最大值与最小值之是资料中最大值与最小值之差,又称为差,又称为极差极差(range),用,用R表示,即表示,即 R=Max(x)-Min(x)本例本例R=65.0-37.0=28.0(kg)监滥抢亦焚偏邦慰吴盏双虚沉抒磅瘦恨隧嘉小删渣胳叛素桨搞铣虞挤拾始资料的整理与基本分析资料的整理与基本分析下一张下一张主主页页退退出出上一张上一张(2-1)
24、、确定组数)、确定组数组数的多少视样本含量及资料的变动范组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当,响反映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。不宜过多,亦不宜过少。分组越多所求得的分组越多所求得的统计量越精确,但增大了运算量;若分组过统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。统计量的精确性也较差。一般组数的确定,一般组数的确定,可参考表可参考表2-5。狰衙碟盎峪颇革坪携鄙葡涝椅者分
25、轿授被职惧铅患登驻常裂档褪募倪傲尘资料的整理与基本分析资料的整理与基本分析表表2-5样本含量与组数样本含量与组数本例中,本例中,n126,根据表,根据表2-5,初步确定组,初步确定组数为数为10组。组。下一张下一张主主页页退退出出上一张上一张迁特匣嫁辖已腑朗悯钳淀臼迂无摄潭蛀甩饲闺剃皖镜改缨帆晰蛾突舜倪皑资料的整理与基本分析资料的整理与基本分析(2-2)、确定组距)、确定组距每组最大值与最小值之差称为组距,记每组最大值与最小值之差称为组距,记为为i。分组时要求各组的组距相等。组距的。分组时要求各组的组距相等。组距的计算公式为:计算公式为:组距组距(i)全距组数全距组数本例本例i28.0103.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 整理 基本 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。