-各种常见随机化的SAS实现.doc
《-各种常见随机化的SAS实现.doc》由会员分享,可在线阅读,更多相关《-各种常见随机化的SAS实现.doc(7页珍藏版)》请在咨信网上搜索。
1、各种常见随机化的SAS实现在前两期的讲座中我们介绍了实验设计的三要素与四原则1,本期将结合实例重点阐述实验设计中如何实现各种常见的随机化。随机化体现在如下三个方面2:抽样随机:每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到进入样本之中。它保证所得到的样本具有代表性,使实验结论具有普遍意义;分组随机:每个实验对象分配到不同组(通常为对照组、不同处理组)的机会相同。它保证大量难以控制的非处理因素在对比组间尽可能均衡一致,以提高各组间的可比性;实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。本期主要就如何用SAS实现随机抽样和随机分组进
2、行阐述。已知编号为1-20的20例病人的基本信息见表1。本文将以表1数据为例,阐述随机化的SAS实现。表1 20例病人的基本信息病人编号12345678910性别FFMFFFMMMM年龄60643757413160645816病人编号11121314151617181920性别MMFFFFFMFF年龄586323372033394049421. 随机抽样目前在SAS/STAT模块中,有一个与调查设计有关的SURVEYSELECT过程。该过程可用来实现各种随机抽样,包括:单纯随机抽样、系统随机抽样、分层抽样、无限随机抽样(有替换)、序贯随机抽样、以及按规模大小成比例概率抽样(PPS)等。1.1
3、简单随机抽样的实现简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取受试对象。特点是每个个体(样品)被抽中的概率相等,各样品之间完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体样品之间差异程度较小和数目较少时,采用这种方法。例1:从编号为1到20的人中用简单随机化的方法抽取10名作为受试者。用SAS9.1.3实现简单随机抽样的程序如下:data a;input id sex$ age;cards;1F602F64 20F42;run;ods html;proc surveyselect data=a method=srs n=10
4、out=b;run;proc print data=b;run;ods html close;程序说明:首先,创建SAS数据集名为a。然后,调用SURVEYSELECT过程进行随机抽样,并指定一些抽样选项,其中“data=”指定输入数据集,用于指定抽样框;“method=”用于指定随机抽样的方法,srs表示单纯随机抽样;“n=”用于指定抽样大小(此处可以用“rate=”来替换,用于指定抽样率);“out=”用于指定输出数据集,它包含所有被抽到的样本(可以添加选项“rep=number”来规定重复抽样的次数,如“rep=2”命令系统同时抽取2份样本)。最后用PROC PRINT把输出数据集b在输
5、出窗口中显示出来。命令ods html和ods html close用于把程序运行结果以网页格式保存下来。输出结果如下:Selection MethodSimple Random SamplingInput Data SetARandom Number Seed937359000Sample Size10Selection Probability0.5Sampling Weight2Output Data SetB以上是本次单纯随机抽样的基本信息,抽样方法是简单随机抽样(Simple Random Sampling)。由于未指定SEED=选项来规定初始种子,来产生随机数字流。系统使用默认种子作
6、为初始种子(SEED=937359000),如果将来想重新抽取与本次完全相同的样本,可以在抽样时指定同一种子。抽取的样本大小是10。抽样概率(Selection Probability)是指样本被抽中的概率,此处为0.5。对于无分层的单纯随机抽样,样本的抽样概率是一致的。抽样权重(Sampling Weight)是抽样概率的倒数,反映样本信息量的大小。Obsidsexage15F4126F31310M16411M58512M63613F23715F20816F33919F491020F42以上是PROC PRINT命令显示的输出数据集,包括所有被抽中的样本。第二列id显示了被抽中的病人的编号。
7、1.2 分层随机抽样的实现分层抽样,先依据一种或几种特征将总体分为若干个子总体,每个子总体称作一个层,然后从每层中随机抽取一个子样本,这些子样本合起来就是总体的样本。分层抽样所得的样本具有较好的代表性,抽样误差较小。例2:将表1中的20例病人以性别为分层因素,抽取10名受试者。用SAS9.1.3实现分层随机抽样的程序如下:ods html;proc sort data=a;by sex;run;proc surveyselect data=a method=srs n=(6 4) out=b;strata sex;run;proc print data=b;run;ods html close
8、;程序说明:数据步与例1相同,此处省略。过程步,SORT过程用于将数据集a排序,by语句指明按性别进行排序,此处排序方式为先F后M。SURVEYSELECT过程与例1的不同之处在于选项n=(6 4),规定每层中得抽样大小,若每层抽样大小相同,可写为n=n1的形式。此外,还多了一个STRATA语句,该语句用于指定分层变量。主要SAS输出结果如下:ObssexidageSelectionProbSamplingWeight1F 4570.522F 6310.523F13230.524F15200.525F19490.526F20420.527M 3370.528M 8640.529M11580.5
9、210M18400.521.3 系统随机抽样的实现系统抽样,先按照某种顺序将总体中的个体(样品)从1N相继编号,并计算抽样距离K=N/n。式中N为总体样品总数,n为样本容量。然后在1K中抽一随机数i,作为样本的第一个被抽样品,接着取i+K,i+2K,i+(n-1)K,直至抽够n个样品为止。值得注意的是,当总体的被观察样品按顺序有周期趋势或增加(减少)趋势时,容易产生偏倚。例3:将表1中的20例病人按系统随机抽样的方法抽取5名受试者。用SAS9.1.3实现系统随机抽样的程序如下:ods html;proc surveyselect data=a method=sys n=5 out=b;cont
10、rol id;run;proc print data=b;run;ods html close;程序说明:数据步与例1相同,此处省略。SURVEYSELECT过程与例1的不同之处在于选项method=sys,规定抽样方法为系统随机抽样法。此外,还多了一个control语句,该语句用于指定排序的变量。SAS输出结果如下:Obssexageid1F5742M6483M63124F33165F42201.4整群抽样的实现整群抽样是先将总体分成若干群,从中随机抽取几个群;抽中群内的全部个体(样品)组成样本。可将整群抽样转化为简单随机抽样。例如,从10班随机抽取5个班作为受试对象,可看做从10个个体中随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 各种 常见 随机化 SAS 实现
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。