变系数的周期性时间序列模型及其应用.pdf
《变系数的周期性时间序列模型及其应用.pdf》由会员分享,可在线阅读,更多相关《变系数的周期性时间序列模型及其应用.pdf(25页珍藏版)》请在咨信网上搜索。
1、应用概率统计第 40 卷第 1 期2024 年 2 月Chinese Journal of Applied Probability and StatisticsFeb.,2024,Vol.40,No.1,pp.50-74doi:10.3969/j.issn.1001-4268.2024.01.004变系数的周期性时间序列模型及其应用方学莉(上海财经大学统计与管理学院,上海,200433)王守霞(北京大学数学科学学院,北京,100871)摘要:存在于各个领域的时间序列不仅表现出周期性的特征还易受外界因素的影响,而且外界因素的影响并非一成不变,同时,部分时间序列的周期是未知的.对于这样的易受外界因
2、素影响的周期性时间序列,本文旨在构造含有变系数函数的周期性序列模型.将经典的时间序列模型分解成一个含有未知参数的部分线性变系数模型,利用 B 样条逼近外生变量的变系数函数,借助带有 l0惩罚项的最小二乘回归得到未知周期、周期序列以及外生变量的影响系数的估计结果.本文还给出了估计量的理论性质,包括周期估计的相合性、周期序列估计和变系数函数估计的渐近性质.通过第 4 章的模拟,我们展现了本文方法的优越性.最后我们通过三个实际数据的应用展现了本文方法的实用性.关键词:周期估计;l0惩罚;B 样条;变系数模型中图分类号:O212.7英文引用格式:FANG X L,WANG S X.Varying-co
3、efficient model and applications for the periodictime seriesJ.Chinese J Appl Probab Statist,2024,40(1):5074.(in Chinese)1引言由于时间序列数据存在于各个领域,对其研究的方法也在不断完善.早期学者们对于时间序列的研究主要停留在平稳的时间序列,随着时间的推移逐步转移到包含趋势项、周期项以及外生变量的时间序列.表现出周期性并易受外界环境影响的时间序列广泛存在于现实生活的各个领域,不仅存在周期已知的数据,比如月度旅游数据、季度数据等,而且存在周期未知的数据,比如全球年均气温数据、某地
4、区年降雨量数据、天文学上太阳黑子的变化数据等.一方面,某些外生性变量的影响会随时间变化,不可忽视.另一方面,外生性变量的存在对时间序列的周期估计会有一定影响,同时周期的存在也会影响外生性变量系数的估计.因此,如何准确的估计出序列的未知周期对时间序列的后续研究有着非常重要的影响.经典的时间序列分解模型是将序列分解成趋势项、周期项和误差项三部分,然后运用参数法估计趋势,或者采用差分方法剔除周期和趋势,但没有对外生性变量进行进一步研究.对于外生性变量的添加,近来不少学者采用机器学习或深度学习的方法来进行系数估计(参见文献 1、文献 2),但机器学习的方法对周期分量分离效果不如传统分解模型,有中国博士
5、后科学基金项目(批准号:2023M730090)资助.通讯作者,E-mail:.本文 2021 年 7 月 28 日收到,2022 年 2 月 18 日收到修改稿.第 1 期方学莉,王守霞:变系数的周期性时间序列模型及其应用51时也会缺少解释力度.于是考虑是否可在经典分解模型中添加协变量项进行估计.经典线性回归模型是我们最常用的也是最简单的一种引入外生性变量的统计模型,但线性回归模型假定系数是常数,它要求解释变量对响应变量的影响是不变的,而在实际问题中,外生性变量对响应变量的影响不是一成不变的,所以文献 3 提出了变系数回归模型,将经典线性模型的系数变成系函数,从而有了更好的解释能力.文献 4
6、 提出了变系数模型的局部多项式估计方法;文献 5 运用样条方法对部分线性变系数模型的估计问题进行了研究;文献 6采用剖面最小二乘法研究了部分线性变系数模型的估计和检验问题.本文选择用 B 样条方法来估计外生性变量的变系数函数,与其他大部分估计方法相比,B 样条方法具有计算方便、局部控制等许多优点(参见文献 7),并且 B 样条估计达到了非参数估计的最优收敛速(参见文献 8).对于周期未知的时间序列的周期估计问题,有大量的文献对其进行研究.传统的方法是参数法,也就是基于频域分析的三角函数回归法,利用有限个三角函数的线性组合来表达周期项,然后基于周期图或者谱密度去估计未知参数.文献 9 在误差是独
7、立同分布的假设下运用三角函数回归法估计序列的频率;文献 10 运用加权最小二乘法估计频率;文献11 运用极大似然估计法估计时间序列的频率.近年来,非参数周期估计法也在不断发展,对于随机非等距观测的时间序列,比如 Yt=m(Xt)+t,此时周期项 m 是一个周期函数,文献 12 运用非参数核最小二乘回归法估计序列的周期;文献 13 运用非参数核最小二乘回归法对多周期的问题进行了研究;文献 14 采用非参数周期图法对单周期以及多周期问题进行了研究;文献 15 研究了变周期的序列的周期估计问题.对于等距观测的时间序列,周期项是一个周期序列,而不是周期函数,文献 16 将周期估计问题看作模型选择问题,
8、将模型假定为 Yt=m(t)+t,运用交叉验证方法来估计未知周期.但以上文献研究的模型只存在周期分量和误差,当模型存在趋势项和周期项时,也就是经典时间序列分解模型 Yt=g(t/T)+m(t)+t,其中 g()是光滑趋势函数,文献 17运用惩罚最小二乘法和局部线性核估计法对存在光滑趋势的周期序列进行了研究.但文献17 的方法在估计周期时直接忽略趋势项的影响,将模型直接看作 Yt=m(t)+t来估计周期,得到周期的估计后利用局部线性核估计法估计趋势.但是直接忽略趋势项的影响会增大估计量的方差,而且当趋势变化较大时,周期估计量不再准确,这种方法不适用于趋势变化较大的序列,而且他们的模型也没有考虑外
9、生变量的影响.文献 18 利用 B 样条估计改进了文献 17 的方法,但他们的模型也没有考虑任何外生变量.文献 19 使用贝叶斯搜索方法来估计非平稳时间序列中的周期性和变点,但他们的方法依赖于趋势、周期分量甚至误差项的参数假设.文献 20 提出了一种基于正则化奇异值分解的新季节调整方法来灵活捕获两种季节性:不随时间变化的固定季节性和随时间变化的季节性,但他们并未考虑外生变量的影响.而文献 21 和文献 22 则研究了函数型时间序列的周期存在性的检验问题,但他们也假定周期已知.文献 23 采用非线性可加模型研究了外生变量对周期序列的影响,但他们假定周期已知.文献 24 研究了存在趋势和线性协变量
10、效应的周期性时间序列的变点检验问题,但他们是在参数模型假设下进行研究,假定趋势函数具有某种参数结52应用概率统计第 40 卷构并且协变量效应被假定是线性的.然而很多时间序列不仅存在未知周期,同时序列还受其他外生变量的影响,外生变量的影响可能不是线性的,所以他们的方法不适用于极易受到外界因素干扰的周期性时间序列.故为了克服这个局限性,本文改进了模型,利用半参数变系数模型将外生性因素考虑进来,并且允许外生变量对于序列的影响随着时间变化.在估计未知周期时没有像文献 17一样忽略趋势项及其他外生变量,而是利用 B 样条逼近未知变系数函数,然后运用带有 l0惩罚项的最小二乘估计法估计序列的周期,进而得到
11、周期序列和变系数函数的估计.本文给出了估计方法的渐近理论,并通过模拟和实证展现了该方法的优越性和实用性.本文接下来的内容作如下安排:第 2 章介绍了我们的模型及估计方法,将时间序列分解为周期项、外生变量影响项以及误差项,接下来用 B 样条逼近未知系数函数,然后运用带有 l0惩罚项的最小二乘估计法来估计周期、周期项以及外生变量的变系数;第 3 章同时给出本文模型的渐近性质,包括周期估计b 的相合性、周期序列估计 b m 以及外生变量系数函数估计 b 的渐近分布;第 4 章为模拟研究,在不同周期、协变量个数以及变系数函数下说明了本文方法可以很好地捕捉到外生性变量的影响并能精准的估计出周期;第 5
12、章为实证部分,将本文方法应用到实际数据;最后第 6 章为结论,总结本文方法的优缺点,并对未来工作进行了展望.2模型及估计方法对于周期项相互独立的时间序列数据,经典的时间序列分解方法将时间序列写成周期项 m()、时间趋势项 g()以及不规律因素 的加法模型,即Yt=g(tT)+m(t)+t,t=1,2,T,(1)其中,g()是光滑的趋势函数,m(t)为时间序列的周期项,t 是一个平稳的均值为 0 的随机误差项.由于绝大多数时间序列受到外界因素的影响与序列本身的周期波动是相互独立的.模型分解的构成主要受周期项以及协变量的干扰,故本文构造的模型形式为Yt=m(t)+(t)Tz(t)+t,t=1,2,
13、T,(2)其中,m(t)为时间序列的周期项,(t)=(1(t),2(t),p(t)T,z(t)=(z1(t),z2(t),zp(t)T,zi为第 i 个外生性变量,i()该外生性变量的系数函数.对于模型(2)中的各项,作以下假定:首先,对于误差项 t,假定 E(t)=0,本文中并不假定 t 独立,它可以是短期相关的,如 t 可以是一阶自回归模型(AR(1).其次,zi为第 i 个外生性变量,i=1,2,p;若序列中存在趋势项,则可以令 z1(t)1,此时为了保证模型的可识别性,需要假定101(u)du=0,若序列中不存在趋势项,则不需要假定101(u)du=0.外生性变量的选择要求该变量不存在
14、明显的周期性,并会单方向对 Y 有影响.()为外生性变量的变系数函数.本文定义()为单位化时间 t/T 的函数,这样随着样本量 T 的增加,对于第 1 期方学莉,王守霞:变系数的周期性时间序列模型及其应用53系数函数来说,每个小区间内的样本点也越来越多,因而可以更易获得系数函数估计的相合性、渐进正态性、有效性等.这种单位化时间的定义在很多文献中十分常见.最后,本文设置 m(t)tZ是周期为 0的周期序列,而不是周期函数,其中 0是未知整数,是该序列的最小周期,这个设定与文献 17 相同,原因在文献 17 有详细给出:对于等距观测的时间序列,在每个时间点 t,会存在很多个函数值为 m(t)的函数
15、,而且如果周期项为函数,那么0可以不是最小周期,这样会导致周期项 m(t)和最小周期 0均不能识别,所以本文中假定周期项是一个周期序列.注意到周期项 m 是定义在真实时间 t 上的序列,这样方便我们研究周期序列估计的渐近性质,原因在于随着 T 增加,整个周期序列中与 m(t0)相等的样本点也会增加,可以获得更多关于 m(t0)的信息.令 =(1,2,0)T=(m(1),m(2),m(0)T,则 m(t)=0s=1sIs(t),其中 I()为示性函数,Is(t)=I(t=k0+s),其中 k 为非负整数.根据上述讨论,将模型(2)可改写为如下模式:Yt=pi=1i(tT)zi(t)+0s=1sI
16、s(t)+t,t=1,2,T.(3)模型(3)用矩阵的形式表示为Y=Z1 1+Z2 2+Zp p+X0+,(4)其中 Y=(Y1,Y2,YT)T为我们观察到的时间序列的向量,也是我们重点想要分解与估计的向量;Zi i=(zi(1)i(1/T),zi(2)i(2/T),zi(T)i(T/T)T,X0=(I0,I0,)T是 T 0的设计矩阵,其中 I0是 00的单位矩阵;而 =(1,2,T)T是误差向量.如果该时间序列的周期已知,即 0已知,则该模型可退化为一个部分线性变系数模型,我们很容易就可以得到周期序列 m 以及变系数函数()的估计,因此接下来我们需要先对未知周期 0进行估计.下面我们主要讨
17、论如何估计未知周期 0、周期序列 m 以及变系数函数().前面提到文献17 运用惩罚最小二乘法和局部线性核估计法对存在光滑趋势和周期项的经典时间序列分解模型即模型(1)进行了研究.但文献 17 的方法在估计周期时直接忽略了趋势项,忽略趋势项会增大估计量的方差,当趋势变化较大时,周期估计量不再准确,所以文献 17 的方法不适用于趋势变化较大的序列.原因在于直接忽略趋势项意味着我们将模型直接看作 Yt=m(t)+t,将 +g 作为新的误差项,当趋势变化较小时,与原始误差 相差较小,但如果趋势 g 的波动变化较大,那么忽略趋势项后的新误差项 会占据主导地位,从而导致周期项 m 不再明显,难以选择出正
18、确的周期.而本文研究的模型(2)不仅可以包含趋势项还可以包含变系数外生性变量,本文在估计未知周期时没有忽略趋势项和其他外生变量的影响,即没有忽略(t)Tz(t),而是采用 B 样条逼近未知的变系数函数,B 样条在估计未知函数方面是非常实用的工具,被广泛的应用于变系数模型、可加模型等模型估计.54应用概率统计第 40 卷2.1变系数函数的 B 样条估计设 x=(x1,x2,xN),a x1 x2 xN b 为区间 a,b 上的 N 个不同的节点,称 x1=x2=xm+1=a,xm+2=x1,xm+N+1=xN,xm+N+2=x2(m+1)+N=b 为一组扩展的节点.令 Bi(t)=(1)m+1(
19、xi+m+1 xi)xi,xi+1,xi+m+1(t x)m+,其中,(t x)m+=(t x)mItx,xi,xi+1,xi+m+1(t x)m+为函数(t x)m+的均差,同时,由上式定义的 Bi(t),i=1,2,m+N+1 线性无关,为样条函数空间 S(m,x)的一组基,称为 m 次规范化的 B 样条函数基.根据文献 25 递归公式,可得到规范化的 B 样条基函数的递推定义为B0i(t)=1,t xi,xi+1);0,其他.以及Bmi(t)=t xixi+m xiBm1i(t)+xj+m+1 txj+m+1 xj+1Bm1i+1(t).为方便,上式中上标 m 忽略,记 B 样条基向量为
20、B(t)=(B1(t),B2(t),BNT(t),NT=m+N+1.对于任意的 s(t)S(m,x),Rm+N+1存在,使得 s(t)=BT(t),s(t)称为 m 次的 B 样条函数.本文中的时间序列,当周期已知,则可退化为部分线性变系数函数模型.对于第 l个外生性变量的变系数函数,定义Bl(ut)=(B1(ut),B2(ut),BNT(ut)T,ut=tT,t=1,2,T,Bl是基函数在所有单位化时间点 ut=t/T,t=1,2,T 取值组成的 B 样条矩阵,则第 l个变系数函数 l(u),l=1,2,p 的估计为 b l(ut)=BTl(ut)b l,其中 l,l=1,2,p 是NT 1
21、 的向量,称 b l(ut)是 l(ut)的最小二乘 B 样条估计.对于本文模型,记D=z1(1)BT1(u1)z2(1)BT2(u1)zp(1)BTp(u1)z1(2)BT1(u2)z2(2)BT2(u2)zp(2)BTp(u2).z1(T)BT1(uT)z2(T)BT2(uT)zp(T)BTp(uT),T=(T1,T2,Tp),则式(4)用矩阵表示为Y D+X0+=W0+,(5)其中,W0=(X0,D),T=(T,T).当使用 B 样条时,B 样条基函数的个数与节点数和基函数的阶数有关,严格来说,基函数个数 NT等于内部节点数 N 与基函数的阶数(m+1)之和.本文中系数函数的 B 样条估
22、计均使用相同的基函数阶数和相同的节点个数,这个假定在变系数模型中也是比较常见的(参见文献 26).第 1 期方学莉,王守霞:变系数的周期性时间序列模型及其应用552.2未知周期 0的估计周期性数据最小二乘法的惩罚项改进周期 0的取值,直接决定时序模型的变化,故对于其取值可以说是模型的选择.那么一个自然的想法是借助最小二乘回归法,通过最小化残差平方和得到周期估计.具体来说,对于每个可能的周期 1,T(其中 T为所有周期可选值的上界,T可以随着样本量增大而增大),对模型(5)做最小二乘回归,得到 的最小二乘估计:b=(WTW)1WTY.针对参数估计的结果,我们得到残差平方和 RSS():RSS()
23、=Y Wb 2,其中 表示向量的 l2范数.但众所周知,最小二乘回归中,残差平方和往往会随着解释变量的增加而减小.由于对于本文模型,解释变量会与 有关,越大,解释变量的个数越多,故最小化残差平方和往往会高估周期.由于真实周期 0的倍数 C0也是序列 m 的周期,而 C0对应的残差平方和小于真实周期 0的,所以普通最小二乘法得到的周期往往是真实周期的倍数.为了避免这个问题,对较大的周期增加一个较大的惩罚项.这种想法与贝叶斯信息准则(BIC)以及Akaike 信息准则(AIC)类似,AIC 和 BIC 准则是模型拟合度和模型复杂度之间找到一个平衡,我们知道:AIC=2k 2ln(bL),BIC=l
24、n(n)k 2ln(bL),其中 k 是模型的有效参数个数,bL 是模型的似然概率,在最小二乘回归模型中,常用的是如下形式的 AIC、BIC:AIC=2k+nln(RSS),BIC=ln(n)k+nln(RSS),文献 17 用到的准则函数为eQ(,T)=RSS()+T,本文在选择周期时考虑到了外生项,必须对惩罚项加以改变,结合文献 27 半参数部分线性模型下的模型选择方法,本文采用的惩罚项形式为 T(+1)NT,其中 NT是 B 样条基函数的个数,如前一节所述,本文假定外生项变系数基函数个数均相同,T是惩罚参数,这个惩罚项可以作为 l0惩罚(l0惩罚被广泛应用于模型选择等问题的处理).为了保
25、证周期估计的相合性,我们选择如下形式的惩罚参数:T=2T,其中 2=E(2t),T是一个发散的序列需要满足一定条件保证周期估计的相合性(惩罚参数 T满足的条件由定理 6 给出).那么针对周期性时间序列,我们最小化的准则函数 Q 有以下形式:Q(,T)=RSS()+(+1)NTT.最小化该准则函数得到b,b=argmin166TQ(,T).(6)56应用概率统计第 40 卷2.3未知周期序列 m 和变系数函数 的估计通过最小化 Q(,T)得到周期的估计b 后,我们可以很容易地得到周期项 m 和变系数函数 的估计,此时模型变成一个普通的部分线性变系数回归模型,我们对其作最小二乘回归即可得到系数 b
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系数 周期性 时间 序列 模型 及其 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。