基于雇员数据的时序模型比较_刘珊珊.pdf
《基于雇员数据的时序模型比较_刘珊珊.pdf》由会员分享,可在线阅读,更多相关《基于雇员数据的时序模型比较_刘珊珊.pdf(4页珍藏版)》请在咨信网上搜索。
1、2023.6电脑编程技巧与维护图1密度曲线及直方图1概述研究背景与意义选取了1978年2月1991年4月某地区的月度雇员人数来研究雇员率问题,首先研究其数字特征和分布情况,然后分别建立了季节多元回归模型、三参数指数模型、季节性差分自回归滑动平均模型,消除数据的非平稳性因素,分别进行建模、预测和分析,比较3种预测模型的结果,并给出3种模型的应用建议。2描述性分析选取1978年2月1991年4月某地区的月度雇员人数,单位为千人。数据集度量了在这一段时间内以月度为单位的159个数值。数据来自某地区统计局。2.1数据预处理将时间序列数据转换成矩阵进行基本量的探究,该矩阵维度为14行12列,其中,共有9
2、个缺失值。均值为6 746.526,在1978年2月1991年4月之间,最少雇员人数为597.13万人,最多雇员人数为794.16万人。为保证 完 整 的 自 然 年 周 期,考 虑 填 充 缺 失 值。使用均值差补法补充1978年1月的数据缺失。由于1991年缺失8个月份的数组,数值缺失率高于10%,所以在进行描述性统计分析时选择删除1991年的全部数据,对19781990年全部月份的数据进行描述性统计分析(注:此处有关缺失值的处理均为生成描述性统计分析时对矩阵的操作,后续时间序列分析时依旧采用原始数据,因此该处理并不影响时间序列分析)。2.2数据可视化绘制密度估计函数图,密度曲线基及直方图
3、如图1所示。由密度曲线图可知,雇佣人数最多的数量集中在6 4006 500之间,另一个峰值是7 700左右。绘制雇员人数的时序图,如图2所示。从时序图中可以清晰地看到该时间序列数据非平稳并且有较为明显的趋势、季节性和周期性。因此在后续的分析中基于季节性预测法分别采用季节多元回归模型、三参数Holt-Winter加法模型及SARIMA季节性差分自回归滑动平均模型进行拟合预测。预先对该时间序列进行随机性校验,确定该条时间序列非白噪声序列。3季节多元回归模型3.1模型定阶对序列使用确定性时间序列分析方法,运用加法公作者简介:刘珊珊(1995),女,学士,研究方向为概率论与数理统计。基于雇员数据的时序
4、模型比较刘珊珊(北京市海淀区中关村大街59号,北京215123)摘要:使用某地区的雇员数据进行研究,描述性分析并对多种时序模型展开预测分析,对模型预测效果进行应用对比。具体的研究工作与内容包括:使用描述性分析,展示雇员率的数字特征和分布情况;分别建立季节多元回归模型、三参数指数模型、季节性差分自回归滑动平均模型,并进行预测和分析结果;汇总 3 种模型的预测结果,分析论证了模型的可用性。关键词:就业数据预测;描述性分析;季节多元回归模型;三参数指数模型;季节性差分自回归滑动平均模型图2雇员人数时序图0.00000.00050.00100.00150.00200.00250.0030Density
5、0e-002e-044e-046e-048e-04N=156 Bandwidth=194.75500600065007000750080008500Timematrix()Density60006500700075008000197819801982198419861988199060006500700075008000102DOI:10.16184/prg.2023.06.0352023.6电脑编程技巧与维护式分解数据中不同成分,共分解结果如图3所示。分别提取出趋势、季节和随机波动3种成分,并进行了去除缺失值的处理。为保证所去除的缺失值没有对原序列产生较大影响,并且加法公式分解数列成分有效,
6、将上述3种因素相加与原数列进行对比,对比结果如图4所示。其中浅线为原始数据的时序图,深线为分解3种因素后相加的结果(n步平均法前后各损失了6个月的数据)。可见,缺失值的删除并未对原始数据产生显著性影响。3.2随机波动项的处理在分解完原始数据后,依然采用R中自带的Box.Test函数利用LB统计量对于分解出的随机波动进行白噪声检验,发现P值显著小于0.05,随机波动中依然包含有用信息。因此分别以BIC、AIC两种信息准则进行拟合,其结果相同,为均值是0的AR2模型,接下来再对随机波动项的残差进行检验,由检验结果可知P值显著,表示随机项已经为白噪声。对随机波动项的模型进行参数检验,计算相应的t统计
7、量的P值,发现AR2参数不显著,因此舍去这一项。在对模型进行调整后再次进行残差检验,结果表明有效信息已经提取完毕,残差已经是白噪声。根据调整后的模型进行未来18个周期的随机项波动值进行预测,并保存至数据框,据此在下一个阶段进行整体情况预测,预测结果在几期之后显示均值回归。随机波动项的预测趋势如图5所示。3.3季节因素的处理季节项为一组12个固定的数值,将这组数值存储至数据框,以备后续进行整体的预测。12个季节因素值的曲线如图6所示。3.4趋势项的处理对趋势项建立非线性拟合模型,并进行预测,丢失数据两端的趋势与实际情况差异较大,预期模型如图7所示。对模型进行诊断发现,存在异方差性及异常点,因此对
8、模型进行异方差的加权最小二乘估计,但处理后的模型诊断仍存在异方差性,且残差不服从正态分布,问题没有解决。3.5模型的预测及分析对于趋势项进行预测,并存入数据框,继而将3种预测值项进行加和得出总体的预测。但是,由于趋势项的拟合次数过高,导致拟合后的模型不稳定,对时间因素的影响极大,所以对于长期的预测而言有相当大的误差。因此不再做进一步的分析展示,仅在文末进行对比分析。4三参数 Holt-Winter 加法模型4.1预处理及模型参数估计指数平滑法是根据平滑常数来实现的,的取值在01的区间上,越小越接近0,就表示做预测时对图3季节回归模型分解结果图4季节多元回归模型的拟合结果图5随机波动项的预测趋势
9、图612个季节因素值的曲线图7趋势项的预期模型-60-2020-10001978198019821984198619881990randomseasonaltrendobserved580070006000 7000 800019781980198219841986198819906000650070007500800019781980198219841986198819901992-60-2020-10005024681012600070000501001501032023.6电脑编程技巧与维护19801982198419861988199060006500700075008000近期观测所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 雇员 数据 时序 模型 比较 刘珊珊
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。