基于神经网络模型的智能产业板块股价探究.pdf
《基于神经网络模型的智能产业板块股价探究.pdf》由会员分享,可在线阅读,更多相关《基于神经网络模型的智能产业板块股价探究.pdf(9页珍藏版)》请在咨信网上搜索。
1、第2 3卷 第1 4期2 0 2 3年 7月 科 技 和 产 业S c i e n c eT e c h n o l o g ya n dI n d u s t r y V o l.2 3,N o.1 4J u l.,2 0 2 3基于神经网络模型的智能产业板块股价探究庄 妍,王林萍(福建农林大学 经济与管理学院,福州3 5 0 0 0 2)摘要:针对金融波动性和市场风险,基于A股市场上7 0余只智能板块的股票近1 0年的四因子数据,从神经网络模型入手实证分析,利用随机梯度算法对收盘价预测,比较预测值与实际值的模型误差及损失函数,进行因子选取、算法改进及指标择优。结果表明,神经网络模型参数在批
2、次为2、迭代次数为41 5 0时,M S E(均方误差)、MA P E(平均绝对百分比误差)、MA E(平均绝对误差)分别为6 0.1 9 11、3 0.7 3 26、4.8 0 32,收盘价的拟合效果最佳,该参数下的神经网络模型可用于探究股票市场价格趋势,为投资者、金融机构提供一定参考依据。关键词:神经网络;智能产业板块;股票预测;随机梯度下降法;数据拟合中图分类号:F 2 2 4.9;F 2 2 4.3 9 文献标志码:A 文章编号:1 6 7 1-1 8 0 7(2 0 2 3)1 4-0 2 5 0-0 9收稿日期:2 0 2 3-0 3-1 2作者简介:庄妍(2 0 0 0),女,福
3、建泉州人,福建农林大学经济与管理学院,硕士研究生,研究方向为证券市场与投资;王林萍(1 9 6 8),女,福建永春人,福建农林大学经济与管理学院,教授,博士研究生导师,研究方向为金融市场、普惠金融。股票市场越来越被看作经济核心,截至2 0 2 1年9月底,中国股市开户总量超过1.9 3亿户,与其他行业相比,金融市场的风险与短时间内获得巨额利润的可能性成正比。过去几年,中国人工智能应用的市场及规模有着显著发展,人工智能技术的应用提高了社会生产力,智能产业的范围逐渐拓宽到智能城市、智能制造、智能家居等行业,几乎每一个科学领域及其应用都日益智能化。伴随着数字金融的发展或电子金融新形式的出现,金融业也
4、在此发展过程中获益。当代投资者对股票价格趋势的探究欲望越来越强烈,对于投资者来说,准确了解股票价格趋势对其投资和理财规划有着深远的意义;对于公司或机构来说,精准实现的股价预测有助于规划资金,制定合理的经营策略1。股市预测在计算机技术的快速发展下不断更新和整合,数学模型越来越多地被用于预测股票价格趋势。近年来,预测股票长短期趋势的方法有:传统的与宏观经济相结合的分析方法。最初的股价趋势预测方法分为基本面分析与技术面分析两个方法,对宏观经济、行业包括公司经营理念策略、公司报表等的结合分析,判定股票的价格波动与投资性价比,提出投资建议的一种分析方法。时间序列上的计量经济学分析法。基于计量经济学模型的
5、股价预测方法主要使用金融时间序列来预测股价趋势,运用统计回归模型挖掘股票时序数据的内在规律,建立股票过去价格与未来价格的量化关系。基于机器学习的股票趋势分析2。机器学习越来越多地应用于金融。与统计建模相比,机器学习的精力更多地集中在预测能力,而不是集中在对结果的理解上。如神经网络模型从人脑信息出发,根据其运行机制与数学建模结合,模拟人脑外部信息转换能力,广泛应用于模式识别、智能操控、信信息处理等领域。在金融市场的运作中,神经网络模型可以利用其合理性和适用性优势,对历史信息量化,找出股价的变化规律,为股市提供非线性预测系统,故越来越多人将神经网络模型运用于股票市场3。1 神经网络模型股票市场本质
6、是一种受多种因素综合影响的动态、非平稳、高噪声的系统,股票价格趋势预测是股票市场上一个具有挑战性的问题。建立准确度较高、科学实用的选股预测模型进行量化投资,是股票市场上风险有效管理,实现效益最大化的关键一环,能够处理非线性数据的神经网络模型也因此受到国内外学者的青睐。1.1 文献综述国外理论界关于神经网络的研究开始得较早,2 0 0 1年K u o等4提出了一种遗传算法为基础的模糊 神 经 网 络(g e n e t i c f u z z y n e u r a l n e t w o r k,G F NN),以建立模糊推理规则的知识库,可以衡量对股票市场的定性影响。M a j h i等5提
7、出了一个三角函数连接人工神经网络(f u n c t i o n a ll i n kn e u r a ln e t w o r k s,F L ANN)模型,用于中短期股票市场指052数的股价预测。H a f e z i等6则创建一个蝙蝠神经网络多智能体系统(b a r-n e u r a ln e t w o r km u l t i-a g e n ts y s t e m,B NNMA S)来预测长期股价。为了更好地利用智能化技术探究技术指标与股价未来走势之间的 关 系,支 持 向 量 机(s u p p o r tv e c t o rm a c h i n e,S VM)7、逐
8、步 回 归 和 神 经 网 络 的 联 合 使 用8、(E x t r e m eG r a d i e n tB o o s t i n g,X G B o o s t)9都得到广泛应用。K a r a等1 0提出了基于两种分类技术的模型,即 人 工 神 经 网 络(a r t i f i c i a ln e u r a ln e t w o r k,ANN)和支持向量机,结果表明,神经网络模型的平均性能明显优于S VM模型。C h a n g1 1专注于人工神经网络、决策树及ANN与决策树的混合模型三种不同的算法,用于预测股价。研究发现,与其他两种方法相比,ANN更适合在动荡的危机后股市
9、中预测股价。在此背景下,神经网络模型在国外应用日益广泛,因此研究中也不再只单独使用神经网络模型。H a j i z a d e h等1 2认为GA R CH模型与神经网络模型相辅相成,能较好地模拟和预测高度波动市场的波动性。Z h u o等1 3引入主成分分析法,将B P(b a c k p r o p a g a t i o n)神 经 网 络 模 型、P C A-B P(p r i n c i p a l c o m p o n e n t a n a l y s i sb a c kp r o p a g a t i o n)模型和传统A R I MA(3,1,1)模型的预测结果进行了对
10、比。结果表明,神经网络模型在机器学习的高维时间序列数据预测方面表现突出,这也是神经网络模型研究的一大进步。同美国股票市场相比,中国股票市场上近年来对神经网络模型的应用开始得较迟,但是由于神经网络模型的可行性强,发展势头是十分迅猛的,神经网络模型不仅被用于解决物理问题1 4,也广泛运用于量化选股、投资方面1 5。最初谢琪等1 6利用2 0 1 22 0 1 7年的上海证券交易所综合指数等数据,验证了神经网络模型预测精确度高;黄宏运等1 7通过实证分析发现,神经网络模型仅对于短期数据的预测有效;曹晓1 8提出了一类神经网络的混合模型,其在预测精度、效率方面都显著高于单个神经网络模型。纵观已有的关于
11、股票市场的研究,学者们通常将模型建立在整个A股市场上,着眼于预测未来股票价格变化情况,鲜有从模型本身算法的改进入手进行优化。此外,大多数学者选用于研究的时间周期较短,仅选取了近几年的数据,而数据量不够大容易受“黑天鹅”事件的影响。基于此,在深入分析热门的智能产业数据的基础上,进一步阐述基于随机梯度下降算法对神经网络1 9的模型优化,并将结果可视化,尝试对神经网络模型深入探究,以将其应用到股票市场的预测中。1.2 模型简介神经网络模型是模拟人脑对外部输入信息的反应过程的计算机模型,用于分析大量特征和大数据下预测精度低的问题。神经网络模型由输入层、输出层和隐藏层组成,各层级连接线分别设置权重,通过
12、随机抽取训练集计算各层的输出值及误差,由此调整各层权重值。选取恰当权重值检查网络总误差是否达到精度要求,若达到要求,则训练结束,否则继续训练。根据此权重值,形成一个训练好的神经网络模型,用于训练集。随着数据复杂性增加,神经网络算法凭借其预测准确度高、适用范围广、非线性数据分析能力强、不易过拟合等优势,成为股票市场中新的有效分析手段。图1显示了典型的三层神经网络模型的拓扑结构。图1 神经网络模型的拓扑结构1.3 算法原理假设一个神经网络中的神经元是RnR函数,输入函数为X=x1x2xn ,输出函数为Y=y1y2yt ,隐藏层输出为B=b1b2bm ,输入层与隐藏层的权重值矩阵为W=w1w2wm
13、,隐藏层与输出层的权重值矩阵为Z=152 庄 妍等:基于神经网络模型的智能产业板块股价探究 z1z2zt ,期望输出函数为Q=q1q2qt 。1)输入层、隐藏层、输出层的连接:以xi为输入层,wi j为输入层与隐藏层之间的权重;wj为所得隐藏层输入向量,通过函数变化转化为隐藏层输出向量yj。同理,zi j为隐藏层与输出层之间的权重,hk为所得输入层输入向量,通过函数转化成隐藏层输出向量Ok。隐藏层接受输入层,是第j个隐藏层神经元的输出,有uj=ni=1wi jxi(1)式中:i=0,1,n;j=1,2,m。yj=f(uj)(2)式中:i=0,1,n;j=1,2,m。输出层接受隐藏层,是第k个输
14、出神经元的输出,有hk=mj=1zj kyj(3)式中:k=1,2,t。Ok=f(hk)(4)式中:k=1,2,t。s i g m o i d函数作为神经网络的阈值函数,也是激活函数,它将变量x映射到(0,1)。将映射后的函数用S(x)表示,s i g m o i d函数在x过大或过小时,函数变化非常小,即梯度非常接近0,随着神经网络的加深,在使用梯度下降方法的时候,由于梯度接近0,参数更新接近0,神经网络开始学不到东西,即梯度消失。所以经常使用R E L U激活函数,在模型中每层之间加入R E L U函数作为非线性激活单元来防止过拟合,增加非线性表达能力,在股票市场上发挥的作用突出。计算公式
15、为S(x)=11+e-x(5)2)为进一步提升神经网络模型对非线性数据的描述,在求解股票的模型参数时,为了让神经网络模型可以更好地获得数据中蕴含的规律,利用随机梯度下降算法优化。对于一个任意非线性函数y=f(x,),假设其损失函数为L(f(xi,),yi),学习率为。在机器学习算法中,通过将损失函数优化,以达到最优参数寻找的 目 的,该 过 程 使 神 经 网 络 训 练 集 的 损 失(l o s s)无限小,而学习率可以用来控制梯度下降的步长,L(f(xi,),yi)关于的梯度值(偏导)记为?L(f(xi,),yi),最优拟合直线用g表示,有g=1N?L(f(xi,),yi)(6)梯度指向
16、为函数增长最快的方向,为找到梯度最优值,若沿着梯度的负向移动,即-g,即可实现损失函数值(l o s s)最小化的目的,得到局部最优解2 0。在这个过程中,需要计算出所有样本损失函数的梯度,以此求得平均值来更新g=1N?L(f(xi,),yi),这需要很大的内存开销,故随机选取梯度列入考虑范围,仍然可以按正确的梯度列入收敛函数,有g=1m?mi=1Lf(xi,),yi(7)为更高效地测试损失函数达到最小值,引入控制动量,v为动量。有vv-g(8)+v(9)一般情况下,为了在开始时快速地找到神经网络模型正确的收敛方向,设置一个较大的学习率,但需要逐渐地优化防止震荡,故引入梯度大小随时间的积累量r
17、,是一个稳定数值计算的小量,有rr+g2(1 0)-r+g(1 1)由式(1 0)和式(1 1)可知,梯度波动很大时,学习率会快速下降,反之下降速度慢,从而实现了学习 率 的 自 动 调 整。随 机 梯 度 下 降 算 法 如 图2所示。图2 随机梯度下降算法3)训练神经网络的过程,实际上就是在样本输入并运行状态下调整并优化神经网络的权重和偏置值,从而使神经网络模型输出值的误差足够小,损失函数接近预期。神经网络模型的训练过程分前向传输与逆向反馈,随机梯度下降算法是更新层252 科技和产业 第2 3卷 第1 4期 与层之间参数的过程,直到所有的参数都被更新即为训练好的神经网络模型,迭代公式为f(
18、I)i j=f(I)i j-Lf(I)i j(1 2)y(I)i=y(I)i-Ly(I)i(1 3)式中:I为神经网络中的层数;f(I)i j为连接I的第j个节点到I+1层的第i个节点的偏置项的值5,2 1。2 研究设计2.1 数据及参数设定特别关注数学模型的实现细节,研究了用于实现机器学习和深度学习模型的P y t h o n编程语言,这在以前的调查中很少被讨论到。P y t h o n代码中运用了p a n d a s、n u m p y、t o r c h、s k l e a r n等库进行模型的训练及预测,并将数据标准化、缺失值填充等预处理过程写入P y t h o n代码中。由于不同
19、产业股价变化趋势不同,为更好地训练神经网络模型,提取智能产业板块股票作为研究对象,从R E S E E T数据库中下载了A股市场上7 0余只智能板块的股票2 0 1 0年1月1日至2 0 2 1年1 2月3 1日的数据集,以每周为一个研究周期,累计有效数据2万余条,将有效数据按照8 2划分为训练集和测试集。为达到误差值较小、准确度较高的目的,在训练样本 过 程 中,引 入 均 方 误 差(m e a ns q u a r ee r r o r,M S E)、平均绝对误差(m e a na b s o l u t ee r r o r,MA E)、平均绝对百分比误差(m e a na b s o
20、 l u t ep e r c e n t a g ee r r o r,MA P E)作为参照指标,并将批次b a t c h_s i z e与训练次数e p o c h不断修改、循环迭代将神经网络独立执行多次,直到训练集的误差足够小。计算公式为MA P E=1 0 0%nni=1yi-yiyi(1 4)M S E=1nni=1(yi-yi)2(1 5)MA E=1nni=1yi-yi(1 6)式中:yi为原始时间序列的预测值;yi为原始时间序列的实际值;n为观测值个数。2.2 变量选择经过文献查阅,注意到在一些股票价格预测的论文中只考虑了平均价格,但在实际操作中认为收盘价更能体现股票未来变
21、化趋势。因为收盘价既反映市场资金对某个股的关注程度,又反映一天中股票指数的所有行动,具有预示下一个交易日演绎方向的功能,特别是在神经网络模型中,每日收盘价也一定程度上减少数据的噪声。由于当下智能产业景气度的提升,股价等财务指标的影响因素更加宽泛,故对收盘价影响因子划分如表1所示。表1 股价预测四因子影响因子名称符号变动方向市值因子总股数总股数_F u l l s h r由非流通股数而定收盘价收盘价_C l P r成交金额成交金额_T r d s u m正向成交量成交量_T r d v o l正向价值因子市净率市净率_P B负向市现率市现率_P C F负向市销率市销率_P S负向成长因子净 资
22、产 收益率净资 产 收 益 率(摊薄)_R O E正向每股收益每股 收 益(摊 薄)/(元股-1)_E P S正向加 权 平 均 市场周收益率流通 市值加权市场周收益率_W r e t t m v正向加 权 平 均 市场 周 资 本 收益率流通 市值加权平均市 场 周 资 本 收 益_W a r e t t m v正向质量因子流 通 股 周 换手率流通 股 平 均 周 换 手率%_A v g D t r d T u r n R流 通 股 日 换手率流通 股 平 均 日 换 手率%_A v g D t r d T u r n R 市值因子:市值因子容易受到市场风格切换的影响,在市场波动较强的情况
23、下小市值公司表现较为突出,一般以总股数与收盘价的乘积代替股票流通市值检测。价值因子:估值较低的股票有着比高估值的股票更高的预期收益率,杠杆率较高的企业有着显著的超额收益。即使成长型股票有较高的发展空间,但在“价值异象”的驱动下,对价值型股票投资仍能够获得比成长型股票更高的收益率。成长因子:成长类因子值明显较高的股票,其获得超额收益的可能性越大,超额收益率也会越高。而超额收益率为周收益率与加权平均市场周收益率的差值,故它的股价在未来存在较大上涨可能性2 2。质量因子:股票质量主要体现在盈利能力与资金周转率两个方面,质量因子表现越优,投资者会更愿意选择此类蓝筹股。将 初 始 学 习 率l r设 置
24、 为0.0 1,初 始 动 量m o m e n t u m设置为0.9,数据的导入批次b a t c h_s i z e在2、4、8中选取,迭代次数e p o c h在5 0 050 0 0进行调试,虽然模型迭代次数多可以有更高的准确度,但是训练次数过高,模型就会过拟合,最终的预测结果与 真实 值 反 而 相 差 甚 远。随 着 给 定e p o c h的增大,最终预测误差先减小后增大,这意352 庄 妍等:基于神经网络模型的智能产业板块股价探究 味着在不改变其他条件的情况下,存在最合适的e p o c h取值,使预测误差最小。为在保障数据精度的同时兼顾计算效率,将导入数据转化为“f l o
25、 a t 3 2”形式。建模的过程中,通过比较训练步骤和误差,设置神经网络模型总层数为5,利用上采样法选取到3 2个参数传入隐藏层,由于输入的有效因子为1 1个,输出样本维数为1,因此5层神经网络的结构为1 1-3 2-1 6-8-1(图3)。3 实施效果与实证研究3.1 共线性诊断由不同自变量之间的热力图(图4)可以看出,流通股日换手率与流通股周换手率之间的相关性高达0.9左右,即存在很强的多重共线性。在神经网络拟合中也剔除二者之一,以免导致因多重共线性造成的过拟合。3.2 参数的比较择优由于神经网络模型的训练需要更大的计算量,基于C P U的良好代码通常被设计为尽可能从高速缓存中读取更多的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 神经网络 模型 智能 产业 板块 股价 探究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。