分享
分销 收藏 举报 申诉 / 35
播放页_导航下方通栏广告

类型数据处理方法.ppt

  • 上传人:精****
  • 文档编号:2316551
  • 上传时间:2024-05-28
  • 格式:PPT
  • 页数:35
  • 大小:199.17KB
  • 下载积分:12 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据处理 方法
    资源描述:
    数 模 讲 座 数据处理方法周德强什么是数据处理?数据处理是指用简明而严格的方法把获得的实验数据所代表的事物内在的规律提炼出来,得出结果的加工过程,包括数据记录、数据预处理、描绘曲线,从带有误差的数据中提取参数(参数估计),验证和寻找经验规律,外推实验数据等等。数据处理基本方法列表法数据预处理作图法逐差法最小二乘法步骤一:列表法 获得数据后的第一项工作就是记录。列表法就是把数据按一定规律列入表中。这是在记录和处理实验数据时最常用的方法,又是其它数据处理方法的基础。列表法的优点是对应关系清楚、简捷,有助于发现实验中的规律。所以在每一个实验中对所测得的数据首先应考虑列表处理。例1:上海市区社会商品零售总额和全民所有制职工工资总额的数据如下表1上海市区社会商品零售总额和全民所有制职工工资总额(1)列表的基本要求:1表格设计合理,简单明了,重点考虑如何能完整地记录原始数据及相关量之间的函数关系;2表的上方应有表头,写明所列表格的名称;3各标题栏目必须标明物理量的名称和单位(用国际符号字母表示),名称应尽量用符号表示。4.若为测量函数关系的数据表,一般把作为自变量的数据列在上方(按由小到大或由大到小的顺序排列),把作为因变量的数据对应列在下,便于反映出物理量之间的内在联系;(2)表中数据的录入、保存和调用指令驱动模式m文件模式 通常matlab以指令驱动模式工作,即在matlab 窗口下当用户输入单行指令时,matlab 立即处理这条指令,并显示结果,这就是matlab命令行方式。命令行操作时,matlab窗口只允许一次执行一行上的一个或几个语句。matlab的工作模式1.数据文件.matmat文件是matlab以标准二进制格式保存的数据文件,可将工作空间中有用的数据变量保存下来。mat文件的生成和调用是由函数save和load完成的。软件链接1:matlab文件的类型指令驱动模式1、年份数据以1为增量,用产生向量的方法输入。命令格式:x=a:h:bx=a:h:b t=78:872、分别以x和y代表变量职工工资总额和商品零售总额。x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03、将变量t、x、y的数据保存在文件data中。save data t x y 4、进行统计分析时,调用数据文件data中的数据。load data指令驱动模式的不足在matlab窗口输入数据和命令进行计算时,当处理复杂问题和大量数据时是不方便的。因此应编辑m文件。命令行方式程序可读性差,而且不能存储,对于复杂的问题,应编写成能存储的程序文件。m文件模式1.将matlab语句构成的程序存储成以m为扩展名的文件,然后再执行该程序文件,这种工作模式称为程序文件模式。2.程序文件不能在指令窗口下建立,因为指令窗口只允许一次执行一行上的一个或几个语句。m文件简介 包含matlab语言代码的文件称为m文件,其扩展名为m。m文件的语法类似于c语言,但又有其自身特点。它只是一个简单的ASCII码文本文件,执行程序时逐行解释运行程序,matlab是解释性的编程语言。m文件有两类:独立的m文件称命令文件 可调用m文件称函数文件 m文件的类型是普通的文本文件,我们可以使用系统认可的文本文件编辑器来建立m文件。如dos下的edit,windows的记事本和word等(1)命令文件简单的m文件命令文件实际上是一串指令的集合,与在命令窗口逐行执行文件中的所有指令,其结果是一样的。没有输入输出参数。1、输入矩阵:data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02、将矩阵data的数据保存在文件data1中:save data1 data3 3、进行统计分析时,先用命令:load data1load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)说明:若要调用矩阵data的第j列的数据,可用命令:data(:,j)独立的m文件(2)函数m文件需要输入变量,返回输出变量matlab用户可以根据需要编辑自己的m文件,它们可以像库函数一样方便的调用,从而极大地扩展了matlab 的能力。对于某一类特殊问题,如创建了许多m函数文件,则可形成新的工具箱。这种用matlab语言创建定义新的matlab函数的功能,正体现了matlab语言强大的扩展功能。函数m文件的格式:function 返回变量=函数名(输入变量)注释说明语句段程序语句段特定规则:1.函数m文件第一行必须以单词function作为引导词,必须遵循如下形式:function=()2.m文件的文件名必须是.m。3.程序中的变量均为局部变量,不保存在工作空间中。其变量只在函数运行期间有效。1、1.在matlab命令窗口点击file 菜单new m-file 2.edit 用matlab自带的编辑器编制m文件。2、在编辑器中输入(数据)矩阵:data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0 t=data(1,:);x=data(2,:);y=data(3,:)3、将矩阵data的数据保存在文件data2.m中4 4、进行统计分析时,先用命令:data2data2 将文件中的数据调入工作空间。注意:所创建的m文件必须纳入matlab搜索路径后,才能在matlab命令窗口运行。可调用m文件(4)函数句柄函数句柄是matlab6特有的语言结构,其优点:方便地实现函数间互相调用兼容函数加载的所有方式拓宽子函数包括局部函数的使用范围提高函数调用的可靠性减少程序设计中的冗余提高重复执行的效率数组、结构数组、细胞型数组结合定义数据函数句柄的调用和操作可通过函数feval进行函数句柄的调用(1)feval(函数句柄)f_h1=peaks;feval(f_h1)(2)feval(函数句柄,参数列表)f_h=plot;feval(f_h,0:10,0:10)f_h2=sin;feval(f_h2,0:10)等价于%x=0:10;y=sin(x)非matlab数据文件的调入(1)记事本(.txt)文件的调入方法1:先将相关文件中的非数值数据去掉,存为新的txt文件,再用Load 文件名(要带上扩展名,否则load视为.m文件,产生错误)方法2:直接用File菜单下的Import data 操作原始文件,包括字符均可调入(可选)。(2)excel(.xls)文件的调入方法1:直接用File菜单下的Import data 操作原始文件,若文件中有非数值数据可先选择将数据粘贴在剪贴板上,再导入。方法2:xlsread sj3.xls(文件不含有非数值数据)步骤二:数据预处理为什么要预处理数据为什么要预处理数据?1.与现实世界有关与现实世界有关 数据库太大,信息多而杂数据库太大,信息多而杂 数据易受噪声数据、空缺数据和数据易受噪声数据、空缺数据和不一致性数据不一致性数据 的侵扰的侵扰2.提高数据质量,提高挖掘结果的质量提高数据质量,提高挖掘结果的质量3.使挖掘过程更有效、更容易使挖掘过程更有效、更容易为什么要预处理数据为什么要预处理数据?4.为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换和处理,使其消除量纲和具有可比性。如何预处理数据如何预处理数据?一般的预处理方法一般的预处理方法 数据清理、数据集成和变换、数数据清理、数据集成和变换、数据归约据归约.数据变换技术 为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换和处理,使其消除量纲和具有可比性。定义 1 设有序列x=(x(1),x(2),x(n)则称映射f:x y为序列x 到序列y 的数据变换。规范化:将属性数据按比例缩放,使之落入一个小的规范化:将属性数据按比例缩放,使之落入一个小的特定区间特定区间.9)9)小数定标规范化:通过移动属性小数定标规范化:通过移动属性A A的小数点位置进行规的小数点位置进行规范化,计算范化,计算8)z-score8)z-score规范化:属性规范化:属性A A的值基于的值基于A A的平均值和标准差规的平均值和标准差规范化,计算范化,计算例1:上海市区社会商品零售总额和全民所有制职工工资总额的数据如下表1上海市区社会商品零售总额和全民所有制职工工资总额 data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0data=78 79 80 81 82 83 84 85 86 87;23.8 27.6 31.6 32.4 33.7 34.9 43.2 52.8 63.8 73.4;41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155.0 175.0;data1=data;junzhi=mean(data1);junfangcha=std(data1)zuixiao=min(data1)zuida=max(data1)%pr=minmax(data);zongh=sum(data1(:,2:3)xiabiao1=find(data(2,:)35)xiabiao2=find(data(2:3,:)35)i,j=find(data(2:3,:)35);i,j1:年份的规范化公式:n=data(1,:)-zuixiao(1)+1 data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02:商品零售总额和全民所有制职工工资总额的数据无量纲化比如选择公式:z-scorez-score规范化:规范化:BZhun_data2=(data1(:,2)-junzhi(2)./junfangcha(2);BZhun_data3=(data1(:,3)-junzhi(3)./junfangcha(3);BZhun_data=BZhun_data2 BZhun_data3huislilunP420步骤三:作图法 把实验测得值按其对应关系在坐标纸上描绘成曲线,以此揭示各物理量间的相互关系,这种方法称为作图法。作图法是研究物理规律最常用的方法之一。用作图法可以找出物理量之间的函数关系,探索和验证规律,并找出经验公式;求出某些物理量的数值,按照物理量的变化规律,进行合理的内插和外推。作图法还具有简单,使函数关系一目了然的优点。MATLAB绘图.pptplot(n,data(2,:),ro,n,data(3,:),b*)data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0n=data(1,:)-zuixiao(1)+1步骤四:曲线拟合最小二乘法 由于在拟合直线(或曲线)时,有一定的主观随意性,因而拟合出的直线(或曲线)往往是不一样的。由一组实验数据找出一条最佳的拟合直线(或曲线),更严格的方法是最小二乘法。由最小二乘法所得的变量之间的相关函数关系称为回归方程。最小二乘法拟合亦称为最小二乘法回归。最小二乘法拟合data=78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0Xishu=polyfit(n,data(2,:),1)
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:数据处理方法.ppt
    链接地址:https://www.zixin.com.cn/doc/2316551.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork