基于多尺度核自适应滤波的股票收益预测_汤兴恒.pdf
《基于多尺度核自适应滤波的股票收益预测_汤兴恒.pdf》由会员分享,可在线阅读,更多相关《基于多尺度核自适应滤波的股票收益预测_汤兴恒.pdf(9页珍藏版)》请在咨信网上搜索。
1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1385-1393ISSN 1001-9081CODEN JYIIDUhttp:/基于多尺度核自适应滤波的股票收益预测汤兴恒1,2,郭强1,2*,徐天慧1,2,张彩明2,3,4(1.山东财经大学 计算机科学与技术学院,济南250014;2.山东省数字媒体技术重点实验室(山东财经大学),济南250014;3.山东大学 软件学院,济南 250101;4.山东省未来智能金融工程实验室(山东工商学院),山东 烟台264005)(通信作者电子邮箱)摘要:在股票市场中,投资者可通过捕捉历史
2、数据中潜在的交易模式实现对股票未来收益的预测,股票收益预测问题的关键在于如何准确地捕捉交易模式,但受公司业绩、金融政策以及国家经济增长等不确定性因素的影响,交易模式往往难以捕捉。针对该问题,提出一种多尺度核自适应滤波(MSKAF)方法,从过去的市场数据中捕捉多尺度交易模式。为刻画股票的多尺度特征,该方法采用平稳小波变换(SWT)得到不同尺度的数据分量,不同尺度的数据分量蕴含着股票价格波动背后潜在的不同交易模式,然后采用核自适应滤波(KAF)方法捕捉不同尺度的交易模式,以预测股票未来收益。实验结果表明,相较于基于两阶段核自适应滤波(TSKAF)的预测模型,所提方法的预测结果的平均绝对误差(MAE
3、)减小了10%,夏普比率增加了8.79%,可见所提方法实现了更好的股票收益预测性能。关键词:股票收益预测;核自适应滤波;交易模式;多元数据依赖;序列学习中图分类号:TP181 文献标志码:AStock return prediction via multi-scale kernel adaptive filteringTANG Xingheng1,2,GUO Qiang1,2*,XU Tianhui1,2,ZHANG Caiming2,3,4(1.School of Computer Science and Technology,Shandong University of Finance a
4、nd Economics,Jinan Shandong 250014,China;2.Shandong Provincial Key Laboratory of Digital Media Technology(Shandong University of Finance and Economics),Jinan Shandong 250014,China;3.School of Software,Shandong University,Jinan Shandong 250101,China;4.Shandong Provincial Laboratory of Future Intellig
5、ence and Financial Engineering(Shandong Technology and Business University),Yantai Shandong 264005,China)Abstract:In stock market,investors can predict the future stock return by capturing the potential trading patterns in historical data.The key issue for predicting stock return is how to find out
6、the trading patterns accurately.However,it is generally difficult to capture them due to the influence of uncertain factors such as corporate performance,financial policies,and national economic growth.To solve this problem,a Multi-Scale Kernel Adaptive Filtering(MSKAF)method was proposed to capture
7、 the multi-scale trading patterns from past market data.In this method,in order to describe the multi-scale features of stocks,Stationary Wavelet Transform(SWT)was employed to obtain data components with different scales.The different trading patterns hidden in stock price fluctuations were containe
8、d in these data components.Then,the Kernel Adaptive Filtering(KAF)was used to capture the trading patterns with different scales to predict the future stock return.Experimental results show that compared with those of the prediction model based on Two-Stage KAF(TSKAF),the Mean Absolute Error(MAE)of
9、the results generated by the proposed method is reduced by 10%,and the Sharpe Ratio(SR)of the results generated by the proposed method is increased by 8.79%,verifying that the proposed method achieves better stock return prediction performance.Key words:stock return prediction;Kernel Adaptive Filter
10、ing(KAF);trading pattern;multivariate data dependence;sequence learning0 引言 股票时序预测是指利用股票市场历史数据建立预测模型来捕捉潜在的交易模式,从而为投资者理性投资提供指导。精确稳定的股票时序预测模型能够为投资者制定合理投资策略、规避潜在投资风险提供帮助。然而,股票市场是一个受多种因素影响的复杂非线性动态系统1,这使得根据获取的历史信息对股票时序数据进行预测成为一项非常具有挑战性的任务。目前,众多技术被应用于股票时序数据预测领域,如:差文章编号:1001-9081(2023)05-1385-09DOI:10.1177
11、2/j.issn.1001-9081.2022030401收稿日期:2022-03-30;修回日期:2022-05-18;录用日期:2022-05-30。基金项目:国家自然科学基金资助项目(61873145);山东省高等学校青创科技支持计划项目(2019KJN045)。作者简介:汤兴恒(1998),男,山东济宁人,硕士研究生,主要研究方向:数据挖掘、时序数据预测;郭强(1979),男,山东淄博人,教授,博士,主要研究方向:数据挖掘、时序数据分析、计算机视觉;徐天慧(1998),女,山东临沂人,硕士研究生,主要研究方向:时序数据异常检测;张彩明(1955),男,山东乳山人,教授,博士,主要研究方
12、向:计算机图形学、计算机视觉、医学影像处理、时序数据分析。第 43 卷计算机应用分整合移动平均自回归2、卡尔曼滤波3、长短期记忆(Long Short-Term Memory,LSTM)神经网络4。这些方法虽然在平均绝对误差(Mean Absolute Error,MAE)和均方误差(Mean Square Error,MSE)等指标方面表现出较好的性能,但投资者在交易活动中往往更加看重投资行为能否获得较高的回报率。针对这一问题,文献 5 中使用核自适应滤波(Kernel Adaptive Filtering,KAF)捕捉股票时序数据中潜在的交易模式,用以预测股票未来收益。实验结果表明,该方法
13、可以比较准确地捕捉潜在的交易模式,取得较高的回报率。然而,股票市场具有高波动性和非平稳性的特点,这为准确捕捉潜在的交易模式增加了难度6。股票时间序列具有多尺度特征,对股票时间序列进行多尺度分解能够将非平稳的时间序列分解成若干个平稳的子序列,且每个子序列具备不同的尺度波动特征7,这便于进一步捕捉股票市场中潜在的多尺度交易模式,能有效增强股票收益预测模型的性能8。受此启发,本文提出了一种基于多尺度核自适应滤波(Multi-Scale Kernel Adaptive Filtering,MSKAF)的股票收益预测方法。为准确刻画股票时间序列的多尺度特征,该方法对股票时序数据利用平稳小波分解得到具有不
14、同尺度特征的子序列,并对各子序列分别使用核自适应滤波方法进行序列学习,以得到不同尺度的波动规律,捕捉潜在的多尺度交易模式。此外,在处理多元时序数据时,为利用股票间的相互依赖关系9,该方法对每只股票的预测不仅依赖于该只股票的交易模式,还会参考其所依赖股票的交易模式,从而进一步增强模型的预测能力。在公开数据集上的实验结果充分说明了本文方法在股票时序未来收益预测问题上的有效性。1 相关工作 统计预测模型主要基于统计理论对股票时序数据进行预测。针对金融时序预测问题,Sims 提出了向量自回归(Vector Autoregression,VAR)模型10-11。该模型通过将系统中每一个变量作为所有变量的
15、滞后值函数建模得到,从而将单变量自回归模型推广到由多元变量组成的向量自回归模型。然而,VAR 模型仅能对平稳的时序数据作出比较准确的预测,对于受多种因素影响的非平稳数据,VAR模型的预测性能有所下降,这使它的应用范围受到限制。为此,Engle等12在 VAR 的基础上引入误差修正项,提出了向量误差修正模型(Vector Error Correction Model,VECM)。该模型常被用于具有协整关系的非平稳时间序列建模。上述基于统计模型的预测方法一般采用线性形式建立相应的数学模型对时序数据进行拟合,但股票时序数据受多种因素的影响一般呈非线性形式,这导致该类预测方法难以得到理想的预测结果。此
16、外,统计预测模型在建模过程中依赖于数据满足正态分布和平稳性假设,这对于具有非线性、非平稳、非正态等特征的股票时序数据来说,假设条件难以满足。故统计模型对非线性时序数据的拟合效果较差,这限制了该类方法在股票时序预测领域中的应用。伴随着非线性时序预测问题研究的深入,以支持向量机(Support Vector Machine,SVM)和核自适应滤波为代表的核函数方法在时序预测领域得到广泛使用5,13-14。SVM以结构风险最小化为原则,具有良好的泛化能力,但它的关键参数很难确定,这在很大程度上限制了它的应用范围。核自适应滤波是一种记忆学习和纠错相结合的方法,本质是通过一个线性的自适应滤波算法实现非线
17、性函数映射。该类方法结合了神经网络的普适逼近特性和线性自适应滤波方法的凸优化特性5,能够很好地拟合非线性函数关系,被广泛地应用于时间序列预测领域。核最小均方(Kernel Least Mean Square,KLMS)算法15是一种典型的基于核自适应滤波的时序预测方法,但它在进行时序预测时,计算复杂度会随着样本量的增加而增长。为此,Chen等16提出了量化核最小均方(Quantized Kernel Least Mean Square,QKLMS)算法。该方法通过矢量量化技术压缩输入或特征空间,以抑制高斯核结构的增长,降低模型计算复杂度。此外,文献 17 将矢量量化技术与最近实例质心估计方法相
18、结合,提出了最近实例质心 估 计 核 最 小 均 方(Nearest Instance Centroid Estimation Kernel Least Mean Square,NICE-KLMS)算法,在一定程度上解决了核自适应滤波方法随样本数量增加导致的计算复杂度增长的问题,并表现出良好的性能。近年来,基于神经网络的方法因具备优秀的非线性映射能力,在时序预测领域得到了研究人员的广泛关注18-20。基于前馈神经网络的预测方法通过动态调整网络神经元的互连权值来拟合时间序列数据内在的映射关系21,最终能够获得比统计模型更准确的预测结果。但基于前馈神经网络的预测方法并不能反映股票的时序依赖性。为解
19、决这一问题,文献 22 中提出了基于循环神经网络(Recurrent Neural Network,RNN)的股票时序预测方法。RNN可以通过保存并传递上一时刻的状态信息来捕捉时序数据的依赖性。但该模型在训练时会随着隐藏层数量的增加而产生梯度消失或梯度爆炸问题,严重影响预测结果。为此,Hochreiter等23在RNN模型中引入细胞状态和门结构提出了LSTM,较好地缓解了长序列训练过程中的梯度消失和梯度爆炸问题,并在捕捉长期时序依赖方面表现出良好的性能。尽管基于神经网络的预测方法在非线性数据处理方面表现出色,但在训练时通常需要较强的硬件资源和大量的训练数据,并且存在易陷入局部最优解和可解释性较
20、差等缺点,这在一定程度上限制了此类方法在股票时序预测领域的应用。不同于神经网络,核自适应滤波不仅具有较低的计算复杂度和简单的递归更新形式,而且具有较好的可解释性,故本文专注于基于 KAF 的股票时序预测方法。此外,由于股票时序数据具有多尺度特征,因此对它们进行多尺度分解有助于刻画时序数据在不同尺度上的波动规律,捕捉潜在的多尺度交易模式,这对于提升股票预测模型的性能具有重要意义8。鉴于此,本文提出了一种基于多尺度核自适应滤波(MSKAF)的股票收益预测方法。实验结果表明,相较于其他对比方法,本文方法能够获得更高的回报率。2 本文方法 股票是具有多尺度特征的时间序列。本文方法首先使用平稳小波变换(
21、Stationary Wavelet Transform,SWT)对股票数据进行多尺度分解,以获得具有不同尺度特征的子序列;在此基础上,对各子序列使用KAF方法进行序列学习,刻画股票时序数据在不同尺度上的波动规律,捕捉潜在的多尺度交易模式;最后,模型借助捕捉到的多尺度交易模式对股票未来收益作出预测,MSKAF模型如图1所示。此外,为应对KAF方法的计算复杂度会随样本量的增加而增长的问题,本1386第 5 期汤兴恒等:基于多尺度核自适应滤波的股票收益预测文采用分段学习策略和矢量量化技术抑制高斯核结构的增长,实现降低模型计算复杂度的目的。2.1多尺度分解传统的小波变换是进行多尺度分解常用的工具,但
22、因其分解过程中存在下采样操作,会使获得的子序列长度缩减为原始序列长度的一半,导致子序列在时间维度上无法与原始序列相对应,不利于模型对时序数据的进一步分析。与传统的小波变换不同,SWT 在对股票时间序列进行多尺度分解时,由于滤波器的延展,可使多尺度分解后的子序列与原始序列长度相同,保留原始序列中的时间维度信息。因此,本文采用SWT对股票时间序列进行多尺度分解。SWT 的多尺度分解过程如图 2所示。给定原始股票时序数据D=yt:t 1,2,n,t 为时间变量,yt R为第 t时刻的收益。SWT分别通过高通滤波器H0和低通滤波器L0对D进行卷积运算得到子序列D0和D1。在此基础上,将滤波器H0和L0
23、进行插值补零得到H1和L1,并利用H1和L1对D1进行分解得到D1和D2。依此类推,经过k阶分解后,可得到最终的高频子序列Dk-1和低频子序列Dk。2.2异常点检测在时序预测过程中,核自适应滤波方法会为每一个新样本创建内核单元,导致计算复杂度会随样本量的增加而增长14。针对上述问题,本文采用文献 24 提出的异常点检测算法对股票时序数据进行异常点检测,并依据异常点对股票时间序列进行分段,通过分段学习策略实现降低模型计算复 杂 度 的 目 的。如 图 3 所 示,对 于 时 序 数 据D=yt:t 1,2,n,图中实线条代表D的数据波动情况,首先根据序列段 y1,y2,yt-1(图 3 中阴影窗
24、口)的概率密度pt-1计算yt的异常得分,然后依据异常得分判断yt是否为异常点。异常得分通过式(1)计算:Score(yt)=-logpt-1(yt)(1)式(1)被称为对数损失分数,表示yt相较于概率密度函数pt-1的预测损失25。当分数Score(yt)时,表示yt为一个异常点,其中为异常点阈值;反之,yt为正常点。2.3多尺度核自适应滤波本文方法对原始股票时序数据进行多尺度分解后,可以获得具有不同尺度波动规律的子序列。在此基础上,对各个子序列采用核自适应滤波方法进行序列学习,以捕捉潜在的多尺度交易模式。令尺度为 s(由于D0中存在较多干扰,故本文不考虑D0)的子序列表示为Ds=yst:t
25、 1,2,n,通过滑动长度为 m 的时间窗口得到一系列序列段xst=yst-m:yst-1,作为第 t时刻的输入向量;将原始股票数据第 t时刻的收益yt作为样本xst的标签值。MSKAF模型利用核自适应滤波捕捉子序列Ds的波动规律,最终学习出潜在的函数fst(xst),使t时刻的输入样本xst可以预测出其标签值y?st。核自适应滤波算法的递推公式如下:|f0=0 est=yt-fst-1(xst)fst(xst)=fst-1(xst)+estK(xst,)(2)其中:est R称为先验误差;R+是步长因子;K(,)R+是 带 宽 为 R+的 Mercer 核,用 来 控 制 映 射 的 平 滑
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 尺度 自适应 滤波 股票 收益 预测 汤兴恒
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。