STATA统计软件操作.ppt
《STATA统计软件操作.ppt》由会员分享,可在线阅读,更多相关《STATA统计软件操作.ppt(30页珍藏版)》请在咨信网上搜索。
1、STATA统计软件操作统计软件操作n nStataStata入门入门入门入门n nStataStata的数据读入的数据读入的数据读入的数据读入n n数据库的描述数据库的描述数据库的描述数据库的描述n n变量的生成与处理变量的生成与处理变量的生成与处理变量的生成与处理n n数据的合并数据的合并数据的合并数据的合并n n数据的转换数据的转换数据的转换数据的转换n n单变量描述单变量描述单变量描述单变量描述n n双变量描述双变量描述双变量描述双变量描述n n描述数据的统计量描述数据的统计量描述数据的统计量描述数据的统计量n n图形的制作图形的制作图形的制作图形的制作n n参数估计:区间估计参数估计:
2、区间估计参数估计:区间估计参数估计:区间估计n n假设检验假设检验假设检验假设检验n n方差分析方差分析方差分析方差分析n n相关分析相关分析相关分析相关分析n n线性回归分析线性回归分析线性回归分析线性回归分析.Stata入门入门 n n五大功能:五大功能:五大功能:五大功能:n n数据管理、统计分析、图形制作、矩阵运算和程序设计。数据管理、统计分析、图形制作、矩阵运算和程序设计。数据管理、统计分析、图形制作、矩阵运算和程序设计。数据管理、统计分析、图形制作、矩阵运算和程序设计。n n界面:界面:界面:界面:n nCommand(Command(命令命令命令命令)、Results(Resul
3、ts(结果结果结果结果)、Review(Review(回顾回顾回顾回顾)、Variables(Variables(变量变量变量变量)。n n菜单基本功能:菜单基本功能:菜单基本功能:菜单基本功能:n n文件(文件(文件(文件(FileFile)、编辑()、编辑()、编辑()、编辑(EditEdit)、偏好()、偏好()、偏好()、偏好(PrefsPrefs,用户界面设,用户界面设,用户界面设,用户界面设置菜单)、数据(置菜单)、数据(置菜单)、数据(置菜单)、数据(DataData,数据的基本处理、描述、排序、,数据的基本处理、描述、排序、,数据的基本处理、描述、排序、,数据的基本处理、描述、
4、排序、改变变量、生成新变量、整合数据、拆分数据等)、图表改变变量、生成新变量、整合数据、拆分数据等)、图表改变变量、生成新变量、整合数据、拆分数据等)、图表改变变量、生成新变量、整合数据、拆分数据等)、图表(GraphicsGraphics)、统计()、统计()、统计()、统计(StatisticsStatistics数据分析)、使用者数据分析)、使用者数据分析)、使用者数据分析)、使用者(UserUser)、窗口()、窗口()、窗口()、窗口(WindowWindow)、帮助()、帮助()、帮助()、帮助(helphelp)n n快捷根据图表的基本功能:快捷根据图表的基本功能:快捷根据图表的
5、基本功能:快捷根据图表的基本功能:n nLog(Log(记录文件窗口记录文件窗口记录文件窗口记录文件窗口)、Viewer(Viewer(帮助窗口帮助窗口帮助窗口帮助窗口)、Results(Results(分析结果分析结果分析结果分析结果窗口窗口窗口窗口)、Do-file Editor(Do-file Editor(编程窗口编程窗口编程窗口编程窗口)、Data Editor(Data Editor(数据编辑窗数据编辑窗数据编辑窗数据编辑窗口口口口)、Data Browse(Data Browse(数据浏览窗口数据浏览窗口数据浏览窗口数据浏览窗口)、Clear-more-ConditionClea
6、r-more-Condition(显示更多结果显示更多结果显示更多结果显示更多结果)、Break(Break(不要显示更多结果不要显示更多结果不要显示更多结果不要显示更多结果)。.Stata数据的读入数据的读入n nlog文件文件。n n创建文件:创建文件:log using“log using“文件路径和名称文件路径和名称”,其后带,其后带appendappend表示在原有文件的基础上增加新内容,其后表示在原有文件的基础上增加新内容,其后带带replacereplace表示取代原记录文件;表示取代原记录文件;n n暂停:暂停:log offlog off;n n再次开始:再次开始:log o
7、nlog on;n n关闭:关闭:log closelog close。n n数据的存储空间数据的存储空间:n n增加存储空间(增加存储空间(set mem 40mset mem 40m)n n清空存储空间(清空存储空间(clearclear,相当于,相当于drop alldrop all)。)。.Stata数据的读入数据的读入n n数据的读入数据的读入:n n可直接读入下列尾缀形式的数据可直接读入下列尾缀形式的数据.dta/.txt/.raw/.xls.dta/.txt/.raw/.xls;n n读入文件中的部分变量:读入文件中的部分变量:use a b c using“use a b c
8、using“文件路文件路径和名称径和名称”;n n读入文件中的部分样本:读入文件中的部分样本:use“use“文件路径和名称文件路径和名称”in X/Y(Xin X/Y(X、Y Y表示个案序号表示个案序号);n n读入文件中某些特征的样本:读入文件中某些特征的样本:use“use“文件路径和文件路径和名称名称”if”if 条件句;条件句;.数据库的描述数据库的描述n n描述数据的基本情况:描述数据的基本情况:describe,dn ndescribe,simple:describe,simple:只展示变量名;只展示变量名;n ndescribedescribe,shortshort:报告变量
9、总体情况;:报告变量总体情况;n ndescribedescribe,detaildetail:输出全部变量的全部信息;:输出全部变量的全部信息;n ndescribe a b cdescribe a b c:描述部分变量的情况。:描述部分变量的情况。n n变量编码本变量编码本:n ncodebookcodebook。n ncodebook+codebook+变量名:描述变量特征。变量名:描述变量特征。.Stata数据类型及特点数据类型及特点n n与数据类型对应的是数据库中变量的存储类型(storage type):。n n字符型字符型:保存格式为保存格式为strstr,省略表示的是字符位数,
10、省略表示的是字符位数n n数值型:保存格式有数值型:保存格式有byte,int,long,float,doublebyte,int,long,float,double。默认。默认格式是格式是floatfloat,前三种只保留整数,占空间最大到最,前三种只保留整数,占空间最大到最小的顺序是小的顺序是double,float,long,int,bytedouble,float,long,int,byten n压缩变量的命令为compressn nCompressCompress为压缩所有变量;为压缩所有变量;n nCompress yr*Compress yr*为压缩共同前缀的变量;为压缩共同前缀
11、的变量;n nCompress a-cCompress a-c为压缩从为压缩从a a到到c c之间的所有变量。之间的所有变量。.数据库的描述数据库的描述n n描述变量取值的基本命令参数描述变量取值的基本命令参数:n ninspectinspect。n n显示数据显示数据:n nbrowsebrowse直接进入数据的浏览窗口;直接进入数据的浏览窗口;n nlistlist最好指定变量,否则会输出数据中所有变量最好指定变量,否则会输出数据中所有变量的分布。的分布。n n数据排序数据排序:n nsortsort。n n例:比较城乡孩子的性别例:比较城乡孩子的性别bysort urban:inspec
12、t bysort urban:inspect girlgirl或者或者sort urbansort urban然后然后by urban:inspect girl.by urban:inspect girl.变量的生成与处理变量的生成与处理n n注意事项注意事项注意事项注意事项:n n不要使用新变量取代旧变量;不要使用新变量取代旧变量;n n充分了解原始变量的分布以及每个数值代表的含义;充分了解原始变量的分布以及每个数值代表的含义;n n遵循不重不漏;遵循不重不漏;n n将原始变量和新变量的取值进行对比,检查是否有误;将原始变量和新变量的取值进行对比,检查是否有误;注意原始变量的缺失值。注意原始
13、变量的缺失值。n n使用使用使用使用genreplacegenreplace命令生成新变量命令生成新变量命令生成新变量命令生成新变量;n ngenreplace ifgenreplace if共同使用形成分组变量共同使用形成分组变量n nrecoderecode v,gen(nv)v,gen(nv)n nrecode v vrecode v v的的取值取值nvnv的取值的取值 *=*=其他取值其他取值(*(*表示所有其他没有列出表示所有其他没有列出的数值的数值),gengen(新变量名)(新变量名)n nrecode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=
14、6 21=7 *=.,gen(edu)recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen(edu).变量的生成与处理变量的生成与处理n n生成分类变量生成分类变量生成分类变量生成分类变量:n negen egen 新变量命新变量命cutcut(旧变量名),(旧变量名),at at(取值的下限)(取值的下限)n negeg:egen agegrp1=cut(age),at(0,7,13,16,20)egen agegrp1=cut(age),at(0,7,13,16,20)n n按照变量按照变量按照变量按照变量b b的分类生成均
15、值变量的分类生成均值变量的分类生成均值变量的分类生成均值变量:n negen a_mean=mean(a),by(b)egen a_mean=mean(a),by(b)n n生成一个变量生成一个变量生成一个变量生成一个变量b b和和和和c c的行均值变量(的行均值变量(的行均值变量(的行均值变量(avgavg),忽略缺),忽略缺),忽略缺),忽略缺失值失值失值失值:n negen avgegen avgrmean(b c)rmean(b c)n n生成标准数值生成标准数值生成标准数值生成标准数值:n negen zweight=std(weight)egen zweight=std(weigh
16、t)n n计算每一年观察的样本,从而了解在每年的调查计算每一年观察的样本,从而了解在每年的调查计算每一年观察的样本,从而了解在每年的调查计算每一年观察的样本,从而了解在每年的调查中,有多少相同的样本(或相同的个体)中,有多少相同的样本(或相同的个体)中,有多少相同的样本(或相同的个体)中,有多少相同的样本(或相同的个体):n ngen numobs=count(personid),by(personid year)gen numobs=count(personid),by(personid year).数据的合并(纵向)数据的合并(纵向)n n纵向合并纵向合并:n n作用:增加样本量作用:增加
17、样本量n n命令:命令:appendappendn n菜单:菜单:Data-Combine datasets-Append datasetsData-Combine datasets-Append datasets;n n程序:程序:append using“append using“文件路径和名称文件路径和名称”;append append using“using“文件路径和名称文件路径和名称”,keep keep 变量名。变量名。.数据的合并(横向)数据的合并(横向)n n横向合并横向合并横向合并横向合并n n作用:增加变量(作用:增加变量(mergemerge)。)。n n菜单:菜单:D
18、ata-Combine datasets-Merge two datasetsData-Combine datasets-Merge two datasets或或Data-Data-Combine datasets-Merge multiple datasetsCombine datasets-Merge multiple datasetsn n程序:先看使用数据:程序:先看使用数据:use“use“文件路径和名称文件路径和名称”,sort sort 关关键变量名,键变量名,save“save“文件路径和名称文件路径和名称”,replacereplace;n n再看主要数据,再看主要数据,us
19、e“use“文件路径和名称文件路径和名称”,sortsort关键变量名;关键变量名;n n最后,合并数据:最后,合并数据:merge merge 关键变量名关键变量名 using“using“文件路径和文件路径和名称名称”,keepkeep(变量)。(变量)。.数据的合并数据的合并(系统变量)(系统变量)(系统变量)(系统变量)n n关于系统变量:关于系统变量:_merge_merge,它的取值限于,它的取值限于n n1 1观察值仅来自主要数据,使用数据没有匹配的样本,观察值仅来自主要数据,使用数据没有匹配的样本,n n2 2观察值仅来自使用数据,主要数据没有匹配的样本,观察值仅来自使用数据,
20、主要数据没有匹配的样本,n n3 3观察值来自于主要数据和使用数据。观察值来自于主要数据和使用数据。n n若使用若使用updateupdate选项,还会有:选项,还会有:n n4 4观察值来自于主要数据和使用数据,且主要数据的观察值来自于主要数据和使用数据,且主要数据的缺失值得到更新,缺失值得到更新,n n5 5观察值来自于主要数据和使用数据,且两个数据的观察值来自于主要数据和使用数据,且两个数据的数值不匹配。数值不匹配。.数据的转换(数据的转换(reshape)n n数据的结构数据的结构:n n宽数据(宽数据(wide formatwide format)n n长数据(长数据(long fo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- STATA 统计 软件 操作
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。