基于网络搜索数据监测的CPI预测.pdf
《基于网络搜索数据监测的CPI预测.pdf》由会员分享,可在线阅读,更多相关《基于网络搜索数据监测的CPI预测.pdf(6页珍藏版)》请在咨信网上搜索。
1、网络搜索经济类关键词的范围和频率能反映公众的关注度和倾向,可用来对经济指标进行预测,从而预示经济走势。为解决居民消费价格指数()预测中的官方数据滞后问题,使用时间序列法,采用网络搜索监测数据对 进行预测。运用百度指数分析方法,搜集宏观、微观、投资三类指标,对初始指标的百度指数进行主成分分析,拟合出 预测模型。结果表明,预测 和实际 走势基本一致,可比官方数据提前一个月得到预测值,为把握宏观经济走势提供参考。关键词:宏观经济;经济走势;网络搜索;居民消费价格指数;数据监测;百度指数中图分类号:文献标志码:文章编号:()中国互联网中心发布的第 次互联网统计公报显示,截至 年 月,中国互联网用户已达
2、 亿人,比 年 月新增 万人;手机互联网用户达 亿人;互联网普及率达 。在中国网民数量增加的过程中,网络平台从最初的信息发布平台逐渐演变为集信息发布、搜索、交流于一体的社交网络,成为网络信息产生、传播和发酵的平台。这一开放、自由的信息平台,会对网民的情绪、态度和行为等产生影响 。随着网络搜索引擎的出现,越来越多的网民利用搜索引擎对社会热点问题进行搜索和关注,网络上大面积传播和爆发热点问题,相关话题量激增,从而引发网络舆情。这种网络舆情具有爆发快、传播快和消退快的特点,也有可能因为发生新的社会事件而再次爆发,因此网络舆情和社会环境存在密切的相关关系 。这种相关关系已得到国内外学者的验证,并取得了
3、较为丰富的研究成果,其最初应用在流行病检测上。等发现,医学类网站被访问的次数和流感类文章被搜索的次数增加时,总是伴随着流感发病率的上升 。近年来,这种相关性也被应用于经济领域,主要研究可分为微观层面、行业(中观)层面和宏观层面 。在微观层面上:梁留科等从网络舆情角度调研了雾霾对旅游者偏好的影响,发现以旅游逃离雾霾的观念在旅游者中迅速传播,境内游和境外游的流向均出现了变化 。齐丽云等研究发现,企业社会责任的负面事件网络舆情可分为诱发、扩散和消退三个阶段,企业和利益相关者的相互作用是推动舆情发展的原因,在缓解网络舆情时应采取政府调控在先、企业应对在后的方式 。在行业(中观)层面上:等选取多国股票收
4、益数据,发现投资者情绪可以解释投资收益中非基本因素的方差、协方差,表明投资者情绪驱动股票收益率 。欧阳资生等研究了嵌入网络舆情指数的金融机构风险传导效应,指出证券类和银行类机构对外部风险十分敏感,容易受到其他金融机构影响;金融机构风险指标和网络舆情协同变化趋势明显 。在宏观层面上:张崇等发现网络搜索数据和 之间存在协整关系,预测模型可比官方数据提前一个月,并且具备预测转折点的能力 。等使用自回归模型来提高即时预报能力,预测了 个国家的失业率和汽车销售数据,发现在失业率方面 趋势数据可以改变个国家的即时预报能力,网络搜索数量有助于解释汽车销售量差异 。以往研究中,对经济指标的预测属于宏观研究层面
5、,通常是利用历史数据对宏观经济指标进行预测。但宏观经济指标公布的数据量少且存在滞后,这种原始数据的制约,对预测结果准确性存在一定影响 。基于以上考虑,笔者利用投资类大数据对 指数进行预测,在原有宏观、微观经济类搜索指标中增设投资相关指标,以分析网络搜索数据对 指数的综合影响。一、预测方法在以往的 预测文献中,多采用指数平滑法、模型、模型,或以神经网络、灰色理论为基础的预测模型 。上述方法或是利用官方发布数据(具有滞后性)进行预测,或是只能适用于单一通货膨胀或通货紧缩的经济状况。为了更好地对 进行预测,笔者采用了百度指数分析方法,通过收集影响 的各大类关键词搜索指数,拟合 预测模型。利用百度搜索
6、指数进行预测具有独特的优势:一是百度搜索引擎作为当下最庞大的中文搜索引擎,数据量巨大且有代表性。二是利用网络搜索数据进行预测,能够迅速反映网民关心的话题和热点,很好地避免了官方数据的滞后问题。三是能完整反映出网络搜索数据对宏观经济指标的影响,可供政府作为理论依据引导网络舆情。二、关键指标选取目前,关键指标选取主要有两种方法 主观选词法和程序选词法 :主观选词法利用已有研究和自身经验,选择网络中出现的与物价相关的词汇,具体包括宏观、微观、金融等方面的关键词;程序选词法利用网络爬虫技术,对海量网页中与物价相关的关键词进行收集,从中筛选出部分有代表性的词汇。目前,这两种选取方法均有学者使用,也各有优
7、缺点 :采用主观选词法的学者较多,其工作量小,简单易行,在众多研究中已取得很好的效果;程序选词法应用较少,在用程序收集网页信息时,无法判断关键词在网页内容中的态度定位,丢失了网页的语义功能。权衡上述两种方法,笔者先用主观选词法对关键词进行初选,再用程序选词法进行信息爬取。关键指标初选将与物价相关的关键词分为宏观和微观两大类。使用百度指数得到的 关键词如图 所示,并可在此基础上进行主观增加。图 百度指数中 关键词为避免官方数据的滞后性问题,在关键词中增加了投资类指标。自新冠疫情出现以来,全国经济形势下滑,投资受到抑制,因而投资类指标有助于准确反映后疫情时代中国的经济形势及 未来趋势。具体的 个关
8、键指标如表 所示。表 各类关键指标宏观微观投资 物价失业经济 价格通货膨胀投资涨价税收工资就业难猪肉旅游房价今日菜价猪肉价格医疗费住院报销网课费用机票价格看病难房租晒工资政府投资固定资产房地产资本贷款风险理财产品基础建设抑制投资地方政府融资杠杆库存升值沈阳工业大学学报(社会科学版)第 卷 信息爬取初选完成后,对这些指标在网络上的搜索情况进行爬取,渠道主要有百度指数、趋势、搜狗指数、谷歌指数、艾瑞指数、腾讯浏览器指数等流量统计平台。由于百度指数的市场份额达 以上,百度搜索也是目前最大的中文搜索引擎,因此选择百度指数统计平台。百度指数的数据分为 数据、移动数据、移动数据,其中 数据从 年开始统计,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 网络 搜索 数据 监测 CPI 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。