基于高频数据和EN-LSTM的黄金期货短期波动率预测.pdf
《基于高频数据和EN-LSTM的黄金期货短期波动率预测.pdf》由会员分享,可在线阅读,更多相关《基于高频数据和EN-LSTM的黄金期货短期波动率预测.pdf(7页珍藏版)》请在咨信网上搜索。
1、第 卷第 期运 筹 与 管 理 ,年 月 收稿日期:基金项目:国家哲学社会科学基金重点项目()作者简介:邱冬阳(),男,重庆人,博士,教授,硕士生导师,研究方向:中国金融市场波动性,金融风险等;丁 玲(),通讯作者,女,河南周口人,硕士研究生,研究方向:计量方法,金融市场等;何一夫(),男,重庆人,本科生,研究方向:决策分析。基于高频数据和 的黄金期货短期波动率预测邱冬阳,丁 玲,何一夫(重庆理工大学 经济金融学院,重庆 ;香港大学 理学院,香港 九龙 )摘要:以上海黄金期货 年期间的 分钟高频交易数据为样本,选取具有变量选择和长短期记忆特性的 ,运用滚动时间窗口的样本外预测,对比不同数据频率
2、的短期波动率预测模型对波动率的刻画和预测能力。实证研究表明:能拟合上海黄金期货高频交易波动率特征;数据频率会对上海黄金期货短期波动率的预测带来显著影响,分钟的数据频率预测精度明显高于更为低频的数据。研究结论有助于黄金期货市场参与各方分散和化解金融风险。关键词:高频数据;机器学习;黄金期货中图分类号:文章标识码:文章编号:():,(,;,):,“”:,;,()()(),:,:;引言黄金期货价格(简称期价)及其波动性预测是金融学界、实务人士与监管部门持续关注和研究的经典选题。在新冠疫情冲击下,互联网、大数据、人工智能等前沿领域与金融市场的深度融合,引发期货的交易、结算、信息传播模式转变,进而造成黄
3、金期货市场不稳定性、不确定性明显增加,有必要在新的条件下研究黄金期价波动的内在规律,预警和防范“黑天鹅”风险。目前黄金期货市场研究主要集中在国内外市场的关联性 、流动性 、黄金期价的影响因素 等方面,对于黄金期价及波动率预测方面的关注较少。大数据时代下,越来越多的学者应用人工智能、深度学习等新兴方法获得金融大数据等去刻画黄金期价的非线性、非平稳新特征,研究金融高频时间序列的量化投资领域 、投资组合策略 等问题。从实证角度来看,提高高频金融时序数据预测精度的关键就是如何能更好地拟合数据分布特征的智能模型,动态追踪价格变动趋势,进而挖掘出高频交易数据中更有价值的信息 。机器学习和深度学习等智能方法
4、近些年正逐步被金融界所接受。基于此,本 文 集 成 一 个 弹 性 网(,)和长短期记忆网络(,)模型(简称:)进行黄金期价高频波动率的预测。本文的边际贡献:一是在模型改进上,基于高频数据特征采用 组合来预测黄金期货高频波动率,验证了集成模型的预测效果明显优于单独采用 模型;二是实证应用上,实现了高频数据的样本外实时预测,动态收缩滚动时间窗口,提高了金融时间序列预测的实用性。研究设计 黄金期货价格波动特征及影响因素 波动特征我国黄金期价在机器交易及信息数字化传播的时代下,既呈现出波动的聚集性、持续性等经典特征,又呈现出非对称性、非线性等波动新特征。同时,黄金期货吸引了大量的噪声交易者,突出表现
5、为高频交易,并通过机器下单、人工智能预警等方式不断提高交易频率、交易量,进而导致交易价格的高频波动。根据持有成本模型,黄金期货与现货价格之差等于持有成本,持有期间的成交量、持仓量、保证金比率等都是影响持有成本的因素。影响因素影响低频黄金期价主要是政治、经济、矿业、政策、供求、关联市场等基本面因素。在大数据时代,黄金期货高频数据的影响力越来越大。对高频价格波动的影响因素分析中,由于宏观基本面等因素日内变动并不明显,分析中不予考虑。重点分析高频交易中的成交量、持仓量、成交额、开盘价、最高价、最低价、收盘价等数据特征,力图从量价关系中,挖掘出 交易机制下与资产价格发现过程相关的重要信息。此外,技术分
6、析是黄金期价短期波动的重要影响因素,指标变量纷繁复杂,为此,本文应用了 方法来筛选变量,又有效防止过拟合问题。弹性网络()模型弹性网络模型是一种新的正则化和变量选择方法,同 、岭函数基本原理相似,区别在于惩罚项的形式有所差别。大量同类研究证实弹性网优于 ,而 模型无论是在预测准确度还第 期邱冬阳,等:基于高频数据和 的黄金期货短期波动率预测是解释力方面的优势都更为突出。模型参数估计值为:()()式()中,罚因子,用来调节惩罚项的权重。比较式()中 的参数估计值:()()()()式()中,且结合式()同式()的比较,可以看出由于 是相关矩阵根据 进行了缩放,因此 相较于 更为稳定,且预测精度相对
7、更高。长短期记忆()模型黄金期价波动性预测是典型的时序问题,深度学习中的循环神经网络和长短期记忆网络均能够处理,但循环神经网络面临着梯度消失和梯度爆炸的问题。模型具有:第一,解决了循环神经网络存在的梯度问题,更好地适应黄金期货数据特征;第二,黄 金 期 货 的 收 益 率 具 有 长 期 依 赖 性,模型存在明显优势;第三,可以很好地总结非线性期货收益率波动的内在规律,并准确预测未来变动。因此,引入 模型预测黄金期价波动率。借鉴同行把 和 模型组合的前沿做法,形成一种新的集成 模型预测黄金期价的波动率 ,融合了基本的时间序列、机器学习和深度学习模型的优点于一体。数据处理 数据描述选择样本对象是
8、上海期货交易所黄金期货标准连续主力合约,考虑新冠肺炎疫情的影响,样本周期选择为 年 月 日至 年 月 日。高频的原始数据来源于同花顺数据库。为保证时效性更强以及合约转换的有效性最强,选取数据样本为 分钟的收盘价数据:样本期内共 个交易日,以 分钟为抽样频率,每日可得 个高频收益率,去除夜盘交易暂停的时间,最终形成的样本量为 个样本。收盘价序列记为 ,表示第 个交易日的开盘价,表示第 个交易日的收盘价。定义第 日的 分钟收益率 ,公式如下:,(,)()将 日的输出值构造成收益率的计算形式,预测结束 后 归 一 化 计 算 日 的 收 盘 价 预 测 值 ,并与真实值 进行比较。便于比较,对上海黄
9、金期货日内 分钟高频数据进行等间隔抽样,使用 将原始的高频数据抽离成 ,分钟多种不同频率的分时数据分别输入预测模型共产生 个模型(见表 ),进而验证改变数据频率是否能够提升 预测精度。表 不同频率分时数据的样本个数模型时间间隔(分钟)样本个数 指标构建与数据预处理选取两类指标作为黄金期货市场的高频交易特征指标:一类是基本交易指标,具体包括开盘价、最高价、最低价、成交量、成交额、持仓量 项特征指标;另一类是主要技术指标,具体包括 ,(日),(日),(日),(日),(日),(日)共 项特征指标。因指标值量纲和数量级的差异会对模型存在干扰,且还会权重偏移。为消除影响,将输入的各个指 标 数 据 进行
10、 无 量 纲 化调 整,方法 是 归 一化处理。实证研究 实证过程 模型设计()时间序列模型:假设上海黄金期货的变量数据每个记录时间间隔为,则时间序列模型可以表示为:(,)()式()中,是 时刻的上海黄金期货收盘价运 筹 与 管 理 年第 卷的收益率,是 时刻的扰动项,()是连接 时刻之前的收益率到现在 时刻的收益率的函数,是每两次记录之间的时间间隔。根据样本选取数据,即为 ,。对于 分钟的高频数据,可以将式()简写为:(,)()一般来讲,在式()中,随着时间间隔的减小,样本数据之间的相关性则会增强,考虑这点,可以将式()进一步改写为一个完备的基础预测模型:()()变量选择模型:根据研究设计,
11、选择 模型,其目标损失函数为:()()可以看出,弹性网络同时使用了 和 两个正则化,式()惩罚项中 为学习率,为 ,用来控制 和 惩罚项的凸组合。通过初始化变量,设置优化器,遍历迭代训练拟合参数,针对不同频率数据的特点确定学习率 为 ,设定批处理大小 为 ,初始化变量,遍历 次迭代。最终利用 模型确定各变量系数,得到 个模型,系数采用 表示,为简化表达,各个 模型的变量系数及 值详见表 (限于篇幅,只是部分数据,全部数据备索)。根据表 中通过 模型进行变量系数缩放后的各变量再次输入 预测模型。()预测模型:根据长短记忆()模型构建和训练的要求,实证研究部分 运用 开 源 平 台,采 用 编 写
12、 程 序,使 用 搭建循环神经网络的结构。通过大量实验反复调试超参数,最终确定的深度学习模型结构由 层构成,这 层分别为模型输入层、隐藏层、全连接层和模型输出层。表 各弹性网络()模型变量的部分回归系数表变量系数 预测思路首先运用 模型对 维输入变量进行缩放,其次将缩放选择后的变量输入 预测模型进行训练,最终输出上海黄金期货的高频收益率,并依据收益率采用差分绝对值作为上海黄金期货短期波动率变动的代理变量。预测阶段,采取滑动时间窗的样本外预测法,设定时间区间为 年 月 日的 时 分至 时 分,时 分至 时;年 月 日的 时 分至 月 日的 时。具体预测方法是:()将训练的时间步长设为 ,将前 个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 高频 数据 EN LSTM 黄金 期货 短期 波动 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。