时间序列分析——最经典的.doc
《时间序列分析——最经典的.doc》由会员分享,可在线阅读,更多相关《时间序列分析——最经典的.doc(60页珍藏版)》请在咨信网上搜索。
1、 . 【时间简“识”】说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。1.带你看看时间序列的简史现在前面的话 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间
2、”的故事! Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。好从上面那个故事我们看到了1、时间序列的定义按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。2、时间序列分析的定义对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列
3、分析。既然有了序列,那怎么拿来分析呢?时间序列分析方法分为描述性时序分析和统计时序分析。1、描述性时序分析通过直观的数据比较或绘图观测,寻找 序列中蕴含的发展规律,这种分析方法 就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计 时序分析的第一步。2、统计时序分析(1)频域分析方法 原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动 发展过程: 1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间 序列的规律 2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数 3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段
4、特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结 果抽象,有一定的使用局限性(2)时域分析方法 原理:事件的发展通常都具有一定的惯性,这种惯性用统 计的语言来描述就是序列值之间存在着一定的相关 关系,这种相关关系通常具有某种统计规律。 目的:寻找出序列值之间相关关系的统计规律,并拟合出 适当的数学模型来描述这种规律,进而利用这个拟 合模型预测序列未来的走势 特点:理论基础扎实,操作步骤规范,分析结果易于解 释,是时间序列分析的主流方法楼主,说了半天,你终于到正题了,时域分析才是我们经常接触的,你赶紧说说怎么做吧?时域分析方法的分析步骤: 考察观察值序列的特征 根据序列的特征选择适当的
5、拟合模型 根据序列的观察数据确定模型的口径 检验模型,优化模型 利用拟合好的模型来推断序列其它的统 计性质或预测序列将来的发展时域分析方法的发展过程 基础阶段G.U.Yule:1927年,AR模型G.T.Walker:1931年,MA模型,ARMA模型 核心阶段G.E.P.Box和G.M.Jenkins 1970年,出版Time Series Analysis Forecasting and Control 提出ARIMA模型(BoxJenkins 模型) BoxJenkins模型实际上是主要运用于单变量、同方差场合的线性模型 完善阶段异方差场合:Robert F.Engle,1982年,AR
6、CH模型 Bollerslov,1985年GARCH模型多变量场合:C.Granger ,1987年,提出了协整(co- integration)理论非线性场合:汤家豪等,1980年,门限自回归模型用哪些软件可以做时间序列分析呢?S-plus,Matlab,Gauss,TSP,Eviews 和SAS上述软件楼主觉得Eviews是基础版,Gauss是小众版,Matlab&S-pluss是正常小青年SAS,万能的软件BOSS啊下一辑时间序列的预处理!敬请关注!【时间简“识”】2.那些必不可少的预处理 - 计量经济学与统计软件 - 经管之家(原人大经济论坛)bbs.pinggu.org2012-7-
7、27本帖最后由 经管之家(原人大经济论坛)胖胖小龟宝 于 2014-12-12 09:12 编辑上一辑预告说啦本期的主题是时间序列的预处理序列在建模前到底要做哪些预处理呢?首先,大伙都知道的平稳性检验是必须的!说到平稳,其实有两种平稳宽平稳、严平稳严平稳相较于宽平稳来说,条件更多更严格,而我们时常运用的时间序列,大多宽平稳就够了什么是严平稳:是在固定时间和位置的概率分布与所有时间和位置的概率分布相同的随机过程。这样,数学期望和方差这些参数也不随时间和位置变化。(比如白噪声)什么是宽平稳:宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低
8、阶矩平稳(二阶),就能保证序列的主要性质近似稳定。两者关系:一般关系:严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立。特例:不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列。当序列服从多元正态分布时,宽平稳可以推出严平稳。如何判断序列是平稳的?咱们这次先从图形法上看(通常越是简单的方法,往往越能看到问题,图形给出的第一感觉也许就是真相哦)时序图,例如(eviews画滴):分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。 看看上面这个图,很明显的增长趋势,不平稳。我们还可
9、以根据自相关和偏相关系数来查看:还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。 分析:平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。 自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。下面是通过自相关的其他功能 如果自相关是拖尾,偏相关截尾,则用 AR
10、 算法 如果自相关截尾,偏相关拖尾,则用 MA 算法 如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA 是 ARMA 算法的扩展版,用法类似 。一定有同学要问了:楼主检测出来不是平稳的怎么办啊?(楼主:当然要把它整平稳啦)如果遇到数据检测出来不平稳,可以考虑使用差分这个最常用的办法(当然,还有好多种其他方法处理)还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶.差分,直到平稳位置。先来个一阶差分:从图上看,一阶差分的效果不错,看着是平稳的。在图形检验法中,我们能够较为直观的看到数据的一个大致变动趋势,如果它有周期或者上升等趋势,一般就
11、不太平稳,需要做些处理,但图形始终是个主管判断为主的方法,这次,就来说说平稳检验的另一个方法:单位根检验(ADF检验)。ADF检验简介: 检查序列平稳性的标准方法是单位根检验。有6种单位根检验方法:ADF检验、DFGLS检验、PP检验、KPSS检验、ERS检验和NP检验,本节将介绍DF检验、ADF检验。ADF检验和PP检验方法出现的比较早,在实际应用中较为常见,但是,由于这2种方法均需要对被检验序列作可能包含常数项和趋势变量项的假设,因此,应用起来带有一定的不便;其它几种方法克服了前2种方法带来的不便,在剔除原序列趋势的基础上,构造统计量检验序列是否存在单位根,应用起来较为方便。ADF检验是在
12、Dickey-Fuller检验(DF检验)基础上发展而来的。因为DF检验只有当序列为AR(1)时才有效。如果序列存在高阶滞后相关,这就违背了扰动项是独立同分布的假设。在这种情况下,可以使用增广的DF检验方法(augmented Dickey-Fuller test )来检验含有高阶序列相关的序列的单位根。检验步骤(一般进行ADF检验要分3步): 1 对原始时间序列进行检验,此时第二项选level,第三项选None.如果没通过检验,说明原始时间序列不平稳; 2 对原始时间序列进行一阶差分后再检验,即第二项选1st difference,第三项选intercept,若仍然未通过检验,则需要进行二次
13、差分变换; 3 二次差分序列的检验,即第二项选择2nd difference ,第四项选择Trend and intercept.一般到此时间序列就平稳了! tips: 在进行ADF检验时,必须注意以下两个实际问题: (1)必须为回归定义合理的滞后阶数,通常采用AIC准则来确定给定时间序列模型的滞后阶数。在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。 (2)可以选择常数和线性时间趋势,选择哪种形式很重要,因为检验显著性水平的 t 统计量在原假设下的渐近分布依赖于关于这些项的定义。 若原序列中不存在单位根,则检验回归形式选择含有常数,意味着所检验的序列的均值不为0;若原序
14、列中存在单位根,则检验回归形式选择含有常数,意味着所检验的序列具有线性趋势,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离 0 的位置随机变动或具有一个线性趋势,进而决定是否在检验时添加常数项。 若原序列中不存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有线性趋势;若原序列中存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有二次趋势。同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。如果图形中大致显示了被检验序列的波动趋势呈非线性变化,那么便可以添加时间趋势项。本例所选择的基础数据是每日收盘价,上证指数日
15、数据从 1990-12-19至2011-8-9,样本容量为5058,周数据从1990-12-21至2011-8-9,样本容量为1043,深证成指日数据从1991-4-3至 2011-8-9,样本容量为4998,周数据从1991-4-5至2011-8-9,样本容量为1070。在证券市场的实证研究中,通常使用收益率即价格的变化而非价格本身,因为证券价格之间存在明显的序列相关性和趋势性,使得许多分析方法不能使用。在本例中,所采用的数据为收盘价的对数收益序列。 在本例中,通过软件操作得到如下图:运用传统的ADF检验检验时间序列的平稳性,我们发现,上证、深证投资基金日、周收盘指数的对数收益率序列都是平稳
16、的。 从上表中可以看出,在99%、95%和90%置信度下的检验,ADF的T统计值都是小于其值的,即全部是拒绝原假设的,说明都是平稳的。在1%的显著水平下,两市的收益率都拒绝随机游走的假设,说明是平稳的时间序列数据。针对平稳性,楼主做过一个帖子开学大献礼:怎样理解时间序列的“平稳性”?你们可以随便戳预处理还有一项内容就是随机性检验,其实就是俗称的残差白噪声检验标准的正态白噪声为什么残差要是白噪声?答:得到白噪声序列,就说明时间序列中有用的信息已经被提取完毕了,剩下的全是随机扰动,是无法预测和使用的,残差序列如果通过了白噪声检验,则建模就可以终止了,因为没有信息可以继续提取。如果残差不是白噪声,就
17、说明残差中还有有用的信息,需要修改模型或者进一步提取。怎样对白噪声进行检验?答:白噪声检验的步骤为:打开resid序列,view,correlogram,差分阶数选择level,确定,看q统计量的伴随p值是不是很大就行了。下一期差分、延迟算子的故事!补充资料:开学大献礼:怎样理解时间序列的“平稳性”?一、问题的提出经典计量经济模型常用到的数据有三种类型:1时间序列数据(time-series data) ,亦即单一变量按时间的先后次序产生的数据。2截面数据(cross-sectional data) ,亦即多个变量在同一个时间点(截面空间)上产生的数据。3平行/面板数据(panel data/
18、time-series cross-section data),也称时间序列截面数据(time series and cross section data)或混合数据(pool data),是多个变量的时间序列的组合(或称时间序列数据与截面数据的结合)。在这三类数据中,时间序列数据以及截面数据都是一维数据;而面板数据则是统计分析人员在时间和截面空间上取得的二维数据。在经济计量实践中,时间序列数据使用的频率最高。二、平稳性的含义平稳性是用来描述时间序列数据统计性态的特有术语。1时间序列平稳性的定义 假定某个时间序列由某一随机过程(stochastic process)生成,即假定时间序列Xt(t
19、=1, 2, )的每一个数值都是从一个概率分布中随机得到的。如果经由该随机过程所生成的时间序列满足下列条件: 均值E(Xt)=m是与时间t 无关的常数; 方差Var(Xt)=s2是与时间t 无关的常数; 协方差Cov(Xt,Xt+k)=gk 是只与时期间隔k有关,与时间t 无关的常数; 则称经由该随机过程而生成的时间序列是(弱)平稳的(stationary)。该随机过程便是一个平稳的随机过程(stationary stochastic process)。 例如,白噪声(white noise)过程就是平稳的:Xt=ut, utIIN(0,s2)因为它的均值为常数零;方差为常数s2;所有时间间隔
20、的协方差均为零。但随机游走(random walk)过程是非平稳的:Xt=Xt-1+ut , utIIN(0,s2),因为尽管其均值为常数E(Xt)=E(Xt-1),但其方差Var(Xt)=ts2非常数。 不过,若令DXt=Xt-Xt-1,则随机游走过程的一阶差分(first difference)是平稳的:DXt=Xt-Xt-1=ut ,utIIN(0,s2)一般地,在经济系统中,一个非平稳的时间序列通常均可通过差分变换的方法转换成为平稳序列。2时间序列平稳性的理解 凭以推测经济系统(或其相关变量)在未来可能出现的状况,亦即预测经济系统(或其相关变量)的走势,是我们建立经济计量模型的主要目的
21、。而基于随机变量的历史和现状来推测其未来,则是我们实施经济计量和预测的基本思路。这就需要假设随机变量的历史和现状具有代表性或可延续性。换句话说,随机变量的基本特性必须能在包括未来阶段的一个长时期里维持不变。否则,基于历史和现状来预测未来的思路便是错误的。 样本时间序列展现了随机变量的历史和现状,因此所谓随机变量基本性态的维持不变也就是要求样本数据时间序列的本质特征仍能延续到未来。我们用样本时间序列的均值、方差、协(自)方差来刻画该样本时间序列的本质特征。于是,我们称这些统计量的取值在未来仍能保持不变的样本时间序列具有平稳性。可见,一个平稳的时间序列指的是:遥想未来所能获得的样本时间序列,我们能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 经典
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。