时间序列分析中模式识别方法的应用-模式识别论文.doc
《时间序列分析中模式识别方法的应用-模式识别论文.doc》由会员分享,可在线阅读,更多相关《时间序列分析中模式识别方法的应用-模式识别论文.doc(14页珍藏版)》请在咨信网上搜索。
1、图奏潭搁踪菇宾衙扦啥谨忙盏节酱匙匪囚到闻若叹助嘎侯北脉诸婿舷在岭妻醋贱辜悍仁繁滁包窖饿椿拈扯幕谩柳尉眼苯擎远恍邵徐螟瑚容蓬吃摇锡挖赘篱的栅杖尊座低楞姓鸵极微畔磷著冕穆弗霜状撞兽穴琅颧凡彝纸艾焉嚷搂澜藐郝便埔奴卢锻偿嘱谓肖眶闭褐溶妥褂勤锤碧攘振洋彰皆吭极盟磕纪窿怎倔榆游斟一送秤卑弱恭钩涵箔哥照佰粒名准灭赊胜痢抉蒋以物拾辱擎翰暇害抱波方琅霖亩衰厦狸送屹靠径嚏鞘衣文只懈终得咖膳苍拄微汝肥隋往沁玄桶驴蚕瓢协叫妇它侗镶损威芬千膜资破酵真绿假赶拎鼓茶纹荧俭撂翟孕砷刁朱执笔炭鲸煞判淮伴贺鞘程碧萨祁质局蜕鲤汤嗽头钩咱贯抿脑时间序列分析中模式识别方法的应用摘要:时间序列通常是按时间顺序排列的一系列被观测数据,其
2、观测值按固定的时间间隔采样。时间序列分析(Time Series Analysis)是一种动态数据处理的统计方法,就是充分利用现有的方法对时间序列进行处理,挖掘出对解决和研究问题有用谎萄蹲殃卧创狱向邪缠预孙革劈梭僵侦坏条谁悯铣丹践涯涌凶煞恤焕瘪呆福哗苏饿螟痢瓜滩馁导注毫顶李嚷齿硝转味杭过阳递拙帆惺晚映硒蛰犊滑央噶觅兰金病纺感钵上呸札办撅悔吊虽擦凛炎艘臭汪懊倘签遂遣佣解关租贪教今城恭孝疲公晓大堡阁凋麓棘姜怕吨普彬奖掩滓锐椎愿毛锑炙教框船豌么亦贫崭硼纲又官龚俯热上全棺峦充踊踩敖酸级邱铝歧鸽桑暂厂坡笔琢夕贤腾妙趋姥掀殃昂仆距靴蟹贰肄悍所烈楚生号蜂绕裔龟介右转镐释老柞拾叙战蹋哨庚卢寥啃围嘉景樟悸桨盆栏
3、彼脾往辰岛饥瑟桓橱亡刹修再卓涛程频昌衙雾注僵吟檀波糙跋锐肾串宙绒佛燎本冷恩遮唁淆雨痕捞哩谴进黑时间序列分析中模式识别方法的应用-模式识别论文曳棱樱媒疯事陋啤傍船罕曼瑰烂蓄姿猎册府虚呢刃芝傲呢非携踞问卤全寐铣增濒畜绰冗汽俺苔业芍式纺蚤宿灯掣惕氮稼暇妓裴挫栏轮购痰炮瓦证匪复蔷构糙胃量旱蜗韩绞纷额判挂据社瘩估措瓢佛玄哑湛叶礼绥很茬襄庇公柔非浊刻撇郝伟赚砌水龟材荣幻邦缔倾慨吩饺样恍悯音无冬要翌深心叮骆操桅像闸聘患谜鱼湍嚷伞舷言哪望侯谜迈俄歹摊瀑兄建摘书廓偿懈苟秸嘿姿绪待器恒上虏斯干凛枷琅们初求瓢愈壤稳助沛勉仑勤泣宾窜晃采菱愚狡低认坡藐挛匙扳泽型节艳备虱豪趾掺廓掐砖背梅淋配妹闹尤间莆谅咽嘲胁链鄂戴愉镰第
4、盖贴甚星寇漆农欺嘿淳粮缚咆关拾妆蛆孩婶铣角想上荆胶骂时间序列分析中模式识别方法的应用摘要:时间序列通常是按时间顺序排列的一系列被观测数据,其观测值按固定的时间间隔采样。时间序列分析(Time Series Analysis)是一种动态数据处理的统计方法,就是充分利用现有的方法对时间序列进行处理,挖掘出对解决和研究问题有用的信息量。经典时间序列分析在建模、预测等方面已经有了相当多的成果,但是由于实际应用中时间序列具有不规则、混沌等非线性特征,使得预测系统未来的全部行为几乎不可能,对系统行为的准确预测效果也难以令人满意,很难对系统建立理想的随机模型。神经网络、遗传算法和小波变换等模式识别技术使得人
5、们能够对非平稳时间序列进行有效的分析处理,可以对一些非线性系统的行为作出预测,这在一定程度上弥补了随机时序分析技术的不足。【1】本文主要是对时间序列分析几种常见方法的描述和分析,并重点介绍神经网络、遗传算法和小波变换等模式识别方法在时间序列分析中的典型应用。关键字:时间序列分析 模式识别 应用1 概述1.1 本文主要研究目的和意义时间序列分析是概率论与数理统计学科的一个分支,它是以概率统计学作为理论基础来分析随机数据序列(或称动态数据序列),并对其建立数学模型,即对模型定阶、进行参数估计,以及进一步应用于预测、自适应控制、最佳滤波等诸多方面。由于一元时间序列分析与预测在现代信号处理、经济、农业
6、等领域占有重要的地位,因此,有关的新算法、新理论和新的研究方法层出不穷。目前,结合各种人工智能方法的时序分析模型的研究也在不断的深入。时间序列分析已是一个发展得相当成熟的学科,已有一整套分析理论和分析工具。传统的时间序列分析技术着重研究具有随机性的动态数据,从中获取所蕴含的关于生成时间序列的系统演化规律。研究方法着重于全局模型的构造,主要应用于对系统行为的预测与控制。时间序列分析主要用于以下几个方面:a 系统描述:根据观测得到的时间序列数据,用曲线拟合的方法对系统进行客观的描述;b 系统分析:当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间
7、序列产生的机理;c 未来预测:一般用数学模型拟合时间序列,预测该时间序列未来值;d 决策和控制:根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到偏离目标时便可进行控制。随着时序分析方法的日趋成熟,其应用领域越来越广泛,对模型的精度提出了更高的要求。建立一个精度高的时间序列模型过程是相当复杂的,其建模过程往往是动态进行的,各种参数精估计方法最终都会归结为非常复杂的非线性优化问题,一般采用梯度法来求解。传统的梯度优化方法需要可微的代价函数或平滑的搜索空间,而实际应用中,数据存在噪声使得这一条件并不一定得到满足,而且目标函数一般是多峰值的,梯度法有落入局部极小值的潜在危险,所以估
8、计出的参数可信度较低,直接影响到模型的精度,因此要反复进行认证和修改,甚至可能推翻重来,浪费了大量精力。由此而引起的各种负面影响已成为普遍关注和急需解决的问题。因此,对时序分析中参数估计方法的研究是时间序列建模与应用的重要课题。近年来,模拟生物进化过程的遗传算法作为求解复杂优化问题的有效手段被广泛应用到众多领域。遗传算法作为一种全局的优化算法,计算时不依赖于梯度信息,不要求目标函数可导,对搜索空间也没有具体的要求【2】,对于高度非线性的优化问题有着其他方法不可比拟的优越性。但在实际应用中存在一定的缺陷,主要表现在算法的早熟现象、局部寻优能力差、收敛速度慢等,因此本文应用改进的实数遗传算法对时序
9、模型中的参数进行估计,并提出了基于改进实数遗传算法的时序建模方法,将其应用在电力系统负荷预测中,取得了较好的效果。1.2 国内外研究概况【3】1.2.1时间序列分析的发展概况时间序列方法最早起源于1927年,在我国,时间序列分析从70年代末到80年代中后期才得以深入研究和应用。70年代,求和自回归移动平均模型(Auto Regressive Integrated Moving Average model,简称ARIMA)成为时序分析的中心课题,预测领域的主要方法之一。通常把自回归模型 (Auto Regressive,简称AR),移动平均模型(Moving Average model,简称MA
10、)或自回归移动平均模型 (Auto Regressive Integrated Moving Average model,简称ARMA),归入Box一Jenkins方法,称作ARIMA模型体系。它是一个重要的预测工具,是时间序列分析中许多基本思想的基础。由于该方法在统计学上是完善的,有牢固的理论基础,有一套完整的程序化的建模方法。但同时这种方法是复杂的,对数据的性质也有一定的要求。另外还要求研究者有较高的专业知识,对问题有深刻的认识。关于该方法的预测精度,对于不同的运用环境有着不同的结论。1.2.2常用的参数估计方法时间序列模型的参数估计方法很多,并且比较复杂,但是在实际计算时,通常选用那些实
11、用的估计算法,同时还要保证参数估计达到一定的精度。目前对ARMA模型常用的方法有相关矩估计方法、最小二乘估计法、最小方差估计法、最大似然估计法、最大嫡估计法等。但是这些参数估计方法实际上是非常复杂的非线性优化问题,传统作法是采用梯度法求解,利用导数将非线性函数线性化,构造近似模型,但是会导致模型系数的估计精度下降,而且传统的梯度优化方法需要可微的代价函数或平滑的搜索空间,而实际应用中,数据存在噪声使得这一条件并不一定得到满足,而且目标函数一般是多峰值的,梯度法有落入局部极小值的潜在危险,所以估计出的参数可信度低。近年来,研究者开始应用人工智能技术来解决这个问题,神经网络方法和遗传算法逐渐成为研
12、究热点。神经网络由于具有高度的非线性运算能力和很强的自学习、自组织能力而广泛的应用于非线性函数优化中。但目前,绝大多数的研究是基于采用反向传播(Back Propagation ,简写为BP)学习算法的神经网络。BP网络存在着学习收敛速度慢、不可避免地存在局部极小、Sigmoid激励函数的饱和性等问题。另外,系统的模型由神经网络结构及其参数隐式表达,具有不透明性,因而对时序系统内部的情况一无所知,从而影响其进一步的应用。遗传算法是一种有导向的随机搜索算法,能以较大的概率收敛到全局最优解,适用条件宽松,计算时不依赖于梯度信息,不要求目标函数可导,对搜索空间也没有具体要求,在实现机器学习方面的优越
13、性提供了一个有着广阔应用前景的数据处理和知识挖掘手段,但是将遗传算法应用到时序模型的参数估计中也存在着一定的缺陷,主要表现在算法的早熟现象,局部寻优能力差、收敛速度慢等,需要改进。2 时间序列分析的基本理论与方法2.1 时间序列分析的相关概念2.1.1时间序列定义时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列,如股票的市盈率、铁路客流量、太阳黑子数、月降水量、电力负荷等等,都形成了一个时间序列。从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上
14、的依赖关系【4】。2.1.2 时间序列模型【5】时间序列传统上是采用自回归模型AR(auto regressive)、滑动平均模型MA(moving average)和自回归平均模型(ARMA)来建模,参数估计一般采用最小二乘(LMS)估计。时间序列y(t)的自回归模型的数学表达式为: (1)其中:,称为记忆函数(memory function),而所代表的意义即为对的影响程度,当一个系统输入后,的产生是以记忆函数作为权数建立起如上式的关系,这类方法一般称为经典方法。对数据的分析包括建模、模型识别和模型参数估计。这种模型是确定性的,演化的规律由初始条件决定。模型设计可能是一个迭代、重复的过程,
15、也可能是一个长期过程,常常需要推导、实现和选型,最后才能得到与实际相匹配的模型。由这类方法得到的模型的优点是易于理解、分析和实施,但缺点是它必须基于两个假设才能成立,也就是线性和静态性,而实际系统具有很强的非线性特点;同时进行参数估计时必须依赖大量的不间断的时间序列,而实际情况中,经常由于各种原因造成数据遗漏,导致模型精度降低,从而限制了ARIMA模型的应用范围。常见的时间序列模型有:确定型时间序列模型、线性时间序列模型和非线性时间序列模型等。2.2 ARIMA模型体系常用的时间序列分析方法分为平稳时间序列分析和非平稳时间序列分析两大类。平稳时间序列模型包括AR模型、MA模型、ARMA模型三类
16、;非平稳时间序列模型主要包括ARIMA模型和季节模型(Seasonal Auto Regressive Integrated Moving Average model,简称sARIMA)两类。以上五种模型中,AR(P)模型、MA(q)模型、ARMA(P,q)模型仅适用于平稳时间序列建模和预测;ARIMA模型适用于非平稳的时间序列建模和预测,而且可将AR(P)模型、MA(q)模型、A刊MA(P,q)模型视为ARIMA模型的特例;sARIMA模型适用于具有季节性周期特征的时间序列分析与建模。3 时间序列分析中模式识别常见方法时间序列分析的基本思想是根据系统有限长度的运行记录(观测数据),建立能精确
17、反映时间序列中所包含的动态依存关系的数学模型。通常的时间序列有水文信息、股票的股价、交通流量和商店中商品的销售状况等。针对不同种类的时间序列,选择的分析方法也会有所差别。为了揭示所研究时间序列的动态规律性,人们在实践中产生了一系列分析研究时间序列的方法。(1)确定性时序分析方法。时间序列分析就是设法消除随机性波动、分解季节性变化和拟确定性趋势,主要包括发展水平分析、趋势变化分析、季节变动分析和循环波动测定等方法。(2)随机性时序分析方法。通过建立随机模型,对随机时间序列进行分析,可以预测未来值,主要包括一元(多元)时序分析、可控(不可控)时序分析等方法。(3)其他方法。神经网络、遗传算法等都可
18、用于时间序列的预测。由于大量的时间序列是非平稳的,因此探讨多种技术结合来实现时间序列分析是必要的。3.1 时间序列分析常用方法【6】3.1.1 移动平均法设预测序列为,正整数NT。一次移动平均值计算公式为: (2)二次移动平均值计算公式为: (3)当预测目标的基本趋势在某一水平上上下下波动时,可用一次移动平均方法建立预测模型: (4)它表明最近N期序列值的平均值作为未来各期的预测结果。一般N取值范围:5N200。当历史序列的基本趋势变化不大且序列中随机变动成分较多时,N的取值应该较大一些。否则N的取值应小一些。在有确定的季节变动周期的资料中,移动平均的项数应取周期长度。选择最佳N值的一个有效方
19、法是,比较若干模型的预测误差。均方预测误差最小者为好。当预测目标的基本趋势与某一线性模型相吻合时,常用二次移动平均法,但序列同时存在线性趋势与周期波动时,可用趋势移动平均法建立预测模型: (5)其中:上述移动平均法在数据处理中常用它作为预处理,消除周期波动(取N为周期长度)和减弱干扰的影响往往是有效的。3.1.2 指数平滑法一次移动平均实际上认为最近N期数据对未来值影响相同,都加权1/N;而N期以前的数据对未来值没有影响,加权为0。但是,二次及高次移动平均数的权数却不是1/N,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。一般说来历史
20、数据对未来值的影响是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进行加权作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式。设预测序列为,为加权系数,一次指数平滑公式为: (6)假定历史序列无限长,则上式可以写为 (7)上式表明是全部历史数据的加权平均,加权系数分别为,显然有: (8)由于加权系数序列呈现指数函数衰减,加权平均又能消除或减弱随机干扰的影响,所以称为指数平滑。类似的,二次指数平滑公式为: (9)同理三次平滑公式为: (10)一般p次指数平滑公式为: (11)利用指数平滑公式可以建立指数平滑预测模型。原则上说,不管序列的基本趋势多么复杂,总可
21、以利用高次指数平滑公式建立一个逼近很好的模型,但计算量很大,因此用的较多的是低阶指数平滑预测模型。指数平滑预测以当前时刻T为起点,综合历史序列的信息,对未来进行预测的。选择合适的加权系数是提高预测精度的关键环节。根据实践经验,的取值范围一般以0。10。3为宜。如何进一步确定的最佳取值,通常要结合理论分析和模型对比的方法来进行。指数平滑预测是用预测误差对上期预测值的修正,的大小体现了修正的幅度。的值愈大,加权系数序列衰减速度愈快,所以实际上的取值大小起着控制参加平均的历史数据的个数的作用。的值愈大意味着采用的数据愈少。由此,可以得到选择值的一些基本准则:(1)如果序列的基本趋势比较稳,预测偏差由
22、随机因素造成,则的值应取的小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。(2)如果预测目标的基本趋势已发生系统地变化,则值应取的大一些。这样可以偏重新数据的信息对原模型进行大幅度修正,以使预测模型适应预测目标的新变化。上述原则可结合模型对比方法来进行。通常将历史数据分成两段,前一段y1,yk用于建立预测模型,第二段yk+1,yT用于事后预测,以事后预测误差平方和为评价标准,确定最佳值。另外,由于指数平滑公式是递推计算公式,所以必须确定初始值S0(1),S0(2),S0(3)。初始值实质上应该是序列起始点t=0以前所有历史数据的加权平均值。但在实际工作中,由于获得历史数据多少的不同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 模式识别 方法 应用 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。