R语言实验指导书二.doc
《R语言实验指导书二.doc》由会员分享,可在线阅读,更多相关《R语言实验指导书二.doc(14页珍藏版)》请在咨信网上搜索。
R语言实验指导书二 14 2020年4月19日 文档仅供参考 R语言实验指导书(二) 10月27日 实验三 创立和使用R语言数据集 一、 实验目的: 1. 了解R语言中的数据结构。 2. 熟练掌握她们的创立方法,和函数中一些参数的使用。 3. 对创立的数据结构进行,排序、查找、删除等简单的操作。 二、 实验内容: 1. 向量的创立及因子的创立和查看 有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1 以 及她们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。 1) 将这些州名以字符串的形式保存在state当中。 2) 创立一个为这个向量创立一个因子statef。 3) 使用levels函数查看因子的水平。 2. 矩阵与数组。 i. 创立一个4*5的数组如图,创立一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。 3. 将之前的state,数组,矩阵合在一起创立一个长度为3的列表。 4. 创立一个数据框如图。 5. 将这个数据框按照mpg列进行排序。 6. 访问数据框中drat列值为3.90的数据。 三、 实验要求 要求学生熟练掌握向量、矩阵、数据框、列表、因子的创立和使用。 实验四 数据的导入导出 一、 实验目的 1. 熟练掌握从一些包中读取数据。 2. 熟练掌握csv文件的导入。 3. 创立一个数据框,并导出为csv格式。 二、 实验内容 1. 创立一个csv文件(内容自定),并用readtable函数导入该文件。 2. 查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。 3. 列出airquality的前十列,并将这前十列保存到air中。 4. 查看airquality中列的对象类型。 5. 查看airquality数据集中各成分的名称 6. 将air这个数据框导出为csv格式文件。(write.table (x, file ="", sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)) 三、 实验要求 要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。 实验五 R语言数据的清洗 一、 实验目的 1. 查看数据集的缺失值,并学会对缺失值进行处理。 2. 对异常变量重新赋值。 3. 将某一列的字符型转化为日期型。 4. 利用subset()获取子集。 二、 实验内容 1. 有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。 Ozone <- c(41, 36, 12, 18, NA, 28) Solar.R <- c(190, 118, 149, 313, NA, NA) wind <- c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9) Temp <- c(67, 82, 74, 62, 86, 66) date <- c("1997/05/01","1997/05/02","1997/05/03","1997/05/04","1997/05/05","1997/05/06") air <- data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFactors = FALSE) 2. 使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/年。 3. 使用subset()根据Temp列获取air中Temp大于60小于70的数据。 4. 将air中含有缺失值的列去掉。 5. 找出Temp中大于85的值将其设置为缺失值。 6. 创立一个air1包含两个列q1,q2。用cbind函数添加到air中。 7. 使用names函数查看air的列名,并根据列自己创立一个数据框。使用rbind函数添加到air中 三、 实验要求 要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。 实验六 高级数据管理 一、 实验目的 1. 学会简单的数值和字符处理函数。 2. 学会自己编写一个函数。 二、 实验内容 1. 使用下面代码创立roster数据集。 Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jones", "Janice Markhammer", "Cheryl Cushing", "Reuven Ytzrhak", "Greg Knox", "Joel England", "Mary Rayburn") Math <- c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522) Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86) English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18) roster <- data.frame(Student, Math, Science, English, stringsAsFactors=FALSE) 2. 使用length函数查看Student的长度。 3. 计算该班级数学的平均成绩,最高成绩。 4. 将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前 20%,下20%,等等)给出从A到F的评分。 1) 使用quantile函数按20%,40%,60%,80%,求分位数。 2) 使用变量重命名的方法将grade列分为A、B、C、D、F几个等级。 3) 使用strsplit 函数将Student列的名字分割,存到name中。 4) 创立一个函数x1,功能为实现返回值为传入参数的第一个值。 5) 使用sapply 函数将name中的firstname提取出来。(“sapply(data,function)”)同理即可提取出lastname。 6) 将lastname和firstname与roster合并,同时去掉roster的第一列。 7) 将成绩单用姓和名进行排序。 三、 实验要求 要求学生学会一些简单的数值和字符处理函数。学会如何自己创立一个函数。和对一些简单问题的处理。 实验七 基本统计分析实验 一、 实验目的 1. 学会使用summary函数和Hmisc包中的describe函数来计算统计量。 2. 使用table函数生成一维、二维、多维列联表。 3. 学会用R实现卡方独立性检验。 4. 学会用R进行相关性的度量。 5. 学会用R进行Pearson、Spearman和Kendall相关。 6. 学会用R进行相关性的显著性检验。 7. 学会用R进行组间差异的非参数检验。 二、 实验内容 1. 描述性统计分析 1) 对R自带的数据集rock(48块石头的形态数据)使用summary函数、Himisc包中的describe函数、pastecs包中的stats.desc函数计算描述性统计量。 2) 使用aggregate、doby中的summaryBy对sleep数据集的group列分组获取描述性统计量。 2. 频数表和列联表 1) 加载vcd包中的Arthritis数据集使用table生成简单的频数统计表。 2) 使用table、xtabs对Arthritis生成二维列联表。并使用addmargins为这些表格添加边际和(根据Treatment、Improved)。 3) 使用xtabs,table生成三维列联表(根据Treatment、sex、Improved三个因子)。 4) 使用chisq.testhan()函数对二维表的行和列进行卡方独立性检验,并观察她们是否独立。 5) 使用vcd包中的assocstats()函数计算二维列联表的phi系数、列联系数和Cramer’s V系数。 3. 相关 1) Pearson、Spearman和Kendall相关 a) 对state.x77数据集计算方差和协方差、Pearson积差相关系数、Spearman等级相关系数。 b) 使用psych包中的corr.test对state.x77数据集Illiteracy、Murder因子计算相关显著性检验 4. T检验 1) 比较了南方(group 1)和非南 方(group 0)各州的监禁概率(使用MASS包中的t.test独立样本的t检验,So因子为是否为南方,Prob因子表示监禁率)。 5. 组间差异的非参数检验。 1) 使用Mann–Whitney U检验回答4中关于监禁率的问题,。 三、 实验要求 经过本次实验让学生学会基本统计分析用到的频数表、列联表、相关、t检验、组间差异的分参数检验。让学生能够掌握一些基本的统计分析的概念和如何用R来进行统计分析。- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 实验 指导书
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文