科研数据的分析与处理-(2).ppt
《科研数据的分析与处理-(2).ppt》由会员分享,可在线阅读,更多相关《科研数据的分析与处理-(2).ppt(77页珍藏版)》请在咨信网上搜索。
1、医学科研数据的整理与分析医学科研数据的整理与分析Data Sorting and Analysis Data Sorting and Analysis in Medical Researchin Medical Research李志春李志春新乡医学院公共卫生学院新乡医学院公共卫生学院医学科研数据的整理与分析医学科研数据的整理与分析医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分析科研数据的综合分析第五节第五节 统计分析结
2、果的解释与表达统计分析结果的解释与表达一、对象的检查一、对象的检查二、缺项与差错二、缺项与差错三、资料的整理三、资料的整理第一节第一节 科研数据的检查与整理科研数据的检查与整理一一、对象的检查对象的检查 首先要鉴别所调查或研究的个体是否属于所规定首先要鉴别所调查或研究的个体是否属于所规定的调查对象或研究对象。的调查对象或研究对象。在进行临床研究时,要特别注意疾病诊断、分类在进行临床研究时,要特别注意疾病诊断、分类的正确性,这对于保证研究结果的正确性是十分必要的正确性,这对于保证研究结果的正确性是十分必要的。的。由于多种原因在一些调查表中经常可以见到缺项由于多种原因在一些调查表中经常可以见到缺项
3、的存在,缺项的存在严重地影响到资料的完整性。的存在,缺项的存在严重地影响到资料的完整性。通过检查发现研究资料中的差错也是十分必要的,通过检查发现研究资料中的差错也是十分必要的,应对研究数据作认真的检查。应对研究数据作认真的检查。二二、缺项与差错检查缺项与差错检查专业检查专业检查统计检查统计检查二二、缺项与差错检查缺项与差错检查人工检查人工检查计算机检查计算机检查二二、缺项与差错检查缺项与差错检查在周密实验设计指导下获得的实验数据,不应在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结果的真实性与完整性就会受随意舍弃,否则实验结果的真实性与完整性就会受到破坏。到破坏。可疑数据的处理可疑
4、数据的处理在在该该数数据据指指标标服服从从正正态态分分布布的的前前提提下下,可可用用统统计计方法检查个别方法检查个别“可疑值可疑值”是否应当舍弃。是否应当舍弃。当当n n1010时时,可可以以用用“”作作为为舍舍弃弃可可疑疑值值的准则。的准则。当当n n1010时时,可可以以采采用用Q Q检检验验法法、DixonDixon检检验验法法或或GrubbsGrubbs检检验验法法,进进行行测测量量值值的的一一致致性性检检验验,从从而而判判断断是否剔除可疑值。是否剔除可疑值。可疑数据的处理可疑数据的处理在对资料做好检查、核对后,就需要把杂乱无章在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以
5、便于进行统计计算与分析,即整理的资料条理化,以便于进行统计计算与分析,即整理资料。资料。三、资料的整理三、资料的整理数据的计算机管理数据的计算机管理数据库的选择数据库的选择数据录入数据录入数据核查与清理数据核查与清理数据加工(如编码、标准化、根据原始记录数据加工(如编码、标准化、根据原始记录产生新的研究变量等)产生新的研究变量等)数据最终锁定并进入分析数据最终锁定并进入分析医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分
6、析科研数据的综合分析第五节第五节 统计分析结果的解释与表达统计分析结果的解释与表达一、统计指标一、统计指标二、统计表二、统计表三、统计图三、统计图第二节第二节 科研数据的描述表达科研数据的描述表达(一)总量指标与相对数指标(一)总量指标与相对数指标(二)平均数指标(二)平均数指标(三)变异指标(三)变异指标一、统计指标一、统计指标 统计表是用表格的方式表达统计资料和指标。在统计表是用表格的方式表达统计资料和指标。在编制统计表时,应该遵循以下原则:编制统计表时,应该遵循以下原则:1.1.重点突出,简单明了重点突出,简单明了。即一张表只包含一个中心内。即一张表只包含一个中心内容,使人一目了然,不要
7、包罗万象。容,使人一目了然,不要包罗万象。2.2.主谓分明,层次清楚主谓分明,层次清楚。二、统计表二、统计表一、统计指标一、统计指标二、统计表二、统计表三、统计图三、统计图第二节第二节 科研数据的描述表达科研数据的描述表达医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分析科研数据的综合分析第五节第五节 统计分析结果的解释与表达统计分析结果的解释与表达(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究
8、变量间关系的研究(四四)判别分析判别分析一、统计分析方法概述一、统计分析方法概述包括有计量资料分布类型的假设检验、计量资料包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计量资料均数的假设检验、等级资方差的假设检验、计量资料均数的假设检验、等级资料分布或位置的假设检验、两种属性间的独立性检验料分布或位置的假设检验、两种属性间的独立性检验以及两种方法判断结果一致性的检验等。以及两种方法判断结果一致性的检验等。(一)假设检验(二)区间估计概念概念:根据样本均数,按一定的可信度计算根据样本均数,按一定的可信度计算 出总体均数很可能在的一个数值范围,这个出总体均数很可能在的一个数值范围,这个
9、范围称为总体均数的可信区间。范围称为总体均数的可信区间。方法方法:(1)u分布法分布法(2)t分布法分布法总体均数(总体均数()的的100(1-100(1-)%)%置信区间置信区间(CI)(CI):(1)(1)已知总体标准差已知总体标准差,按正态分布原理,计算公式为:按正态分布原理,计算公式为:(2)(2)未知,未知,n n较小,按较小,按t t分布原理计算分布原理计算:(3)(3)未知,未知,n n足够大足够大(如如n n100)100),按正态分布原理计算按正态分布原理计算:(二)区间估计总体率的置信区间估计查表法查表法 当当n50时时正态近似法正态近似法 当当样样本本含含量量足足够够大大
10、,且且样样本本率率p和和(1-p)均均不太小。一般认为不太小。一般认为np和和n(1-p)5。pusp(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究变量间关系的研究(四四)判别分析判别分析一、统计分析方法概述一、统计分析方法概述1.1.各指标之间无自变量与因变量之分各指标之间无自变量与因变量之分(1 1)研究变量之间的相互关系有研究变量之间的相互关系有直线相关分析、典直线相关分析、典型相关分析型相关分析等。等。(2 2)研究多个变量的内部从属关系,并寻找综合指研究多个变量的内部从属关系,并寻找综合指标,降低变量的维数,其常用的方法主要有标,降低变量的维数,其常用的方法
11、主要有主成分分主成分分析、因子分析析、因子分析和和对应分析对应分析。(3 3)研究多个变量内部或多个样品之间的亲疏关系研究多个变量内部或多个样品之间的亲疏关系有有聚类分析聚类分析。(4 4)研究多个变量内部的各种复杂关系有线性结构研究多个变量内部的各种复杂关系有线性结构方程的方程的协方差分析协方差分析。(三)变量间关系的研究2.2.各各指指标标之之间间有有自自变变量量与与因因变变量量之之分分 研研究究变变量量之之间间的的依依存存关关系系有有直直线线回回归归分分析析、曲曲线线回回归归分分析析、多多项项式式回回归归分分析析、多多元元线线性性回回归归分分析析、概概率率模模型型回回归归分分析析、生生存
12、存资资料料的的参参数数模模型型回回归归分分析析、COXCOX模模型型回回归归分分析析和和对数线性模型分析对数线性模型分析。(三)变量间关系的研究(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究变量间关系的研究(四四)判别分析判别分析 根据一些明确分类的总体所提供的信根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。息,对未知个体的归属进行分类的判别分析。一、统计分析方法概述一、统计分析方法概述分析目的分析目的资料类型资料类型设计方案设计方案数理统计条件数理统计条件选择统计分析方法需考虑的因素选择统计分析方法需考虑的因素二、计量资料假设检验方法的选择
13、二、计量资料假设检验方法的选择例:欲了解某地城乡婴儿营养状况有无差别,测例:欲了解某地城乡婴儿营养状况有无差别,测例:欲了解某地城乡婴儿营养状况有无差别,测例:欲了解某地城乡婴儿营养状况有无差别,测量了其血红蛋白含量,见下表。量了其血红蛋白含量,见下表。量了其血红蛋白含量,见下表。量了其血红蛋白含量,见下表。首先要明确每次拟分析的定性变量个数是多少?首先要明确每次拟分析的定性变量个数是多少?其其次次要要弄弄清清定定性性变变量量的的属属性性、列列联联表表中中频频数数的的多多少少以及资料的收集方式。以及资料的收集方式。三、计数资料假设检验方法的选择三、计数资料假设检验方法的选择每每次次只只分分析析
14、两两个个变变量量时时,可可将将资资料料整整理理为为2222表表、22k k表表和和R RC C表表的的形形式式。常常用用的的统统计计分分析析方方法法有有Pearson Pearson 2 2检检验验、校校正正2 2检检验验、配配对对计计数数资资料料的的McNemarMcNemar 2 2检检验验、FisherFisher精精确确概概率率法法检检验验、秩秩和和检检验验、RiditRidit分分析析、等等级级相相关关分分析析、典典型型相相关关分分析析、一一般趋势和线性趋势检验、般趋势和线性趋势检验、KappaKappa检验等;检验等;如如果果需需要要同同时时分分析析研研究究的的定定性性变变量量的的
15、个个数数3 3时时,常常用用的的统统计计分分析析方方法法有有加加权权2 2检检验验、Mantel-Mantel-haenszelhaenszel 2 2检验、检验、logisticlogistic回归模型和对数线性模型等。回归模型和对数线性模型等。在在计计数数资资料料的的分分析析过过程程中中,对对于于R RC C表表形形式式资资料料的分析是一个难点,存在的问题比较多。的分析是一个难点,存在的问题比较多。根根据据二二维维列列联联表表中中两两个个分分组组变变量量的的类类型型以以及及分分析析的的目目的的,对对R RC C表表资资料料进进行行分分类类,因因为为不不同同类类型型的的R RC C表资料和不
16、同的分析目的,就有不同的分析方法。表资料和不同的分析目的,就有不同的分析方法。RC表检验方法的选择表检验方法的选择1.1.双向无序双向无序RCRC表资料及其统计分析方法的选择表资料及其统计分析方法的选择2.2.单向有序单向有序RCRC表资料及其统计分析方法的选择表资料及其统计分析方法的选择3.3.双双向向有有序序且且属属性性不不同同的的RCRC表表资资料料及及其其统统计计分分析析方法的选择方法的选择4.4.双双向向有有序序且且属属性性相相同同的的RCRC表表资资料料及及其其统统计计分分析析方法的选择方法的选择RC表检验方法的选择表检验方法的选择对对单单向向有有序序RCRC表表的的两两个个分分组
17、组变变量量,其其中中一一个个是是无无序序的的(实实验验分分组组变变量量不不同同药药品品);另另一一个个却却是是有有序序的的(指指标标分分组组变变量量处处理理效效果果)。此此时时不不适适合合选选用用2 2检检验验分分析析资资料料,因因为为2 2检检验验与与“疗疗效效”的的有有序序性性之之间间没没有有任任何何联联系系,故故应应采采用用与与“有有序序性性”有有联联系的秩和检验或系的秩和检验或RiditRidit分析。分析。RC表检验方法的选择表检验方法的选择对对双双向向有有序序且且属属性性不不同同的的RCRC表表的的两两个个分分组组变变量量,如如年年龄龄组组别别与与某某种种疾疾病病发发生生程程度度都
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科研 数据 分析 处理
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。