基于BP神经网络的厦门楼盘走势预测.doc
《基于BP神经网络的厦门楼盘走势预测.doc》由会员分享,可在线阅读,更多相关《基于BP神经网络的厦门楼盘走势预测.doc(21页珍藏版)》请在咨信网上搜索。
1、2009年集美大学数学建模选拔题选拔题目: 未来5年厦门楼盘走势预测 所属学校: 集美大学诚毅学院 参赛队员:1. 朱文宏 信息工程系电子 0793 2. 林建辉 信息工程系电子 0793 3. 蔡秀丽 信息工程系自动化 0791 日期: 2009 年 8 月 4 日基于BP神经网络的厦门楼盘走势预测摘要:本文基于BP神经网络应用于预测的原理,提出预测步骤及预测可行性,探讨建立基于BP神经网络的预测模型的关键技术,包括样本的选取与预处理、输入输出变量的选取、隐层节点数的确定、初始权值和阈值的选取、激活函数、训练算法与参数的选取,最后建立合理的网络模型;结合住宅市场的实际情况,建立两类BP 神经
2、网络预测模型:基于时间序列的趋势预测模型以及基于影响因素的回归预测模型,即分别采用神经网络趋势预测和回归预测的思路,把住宅市场的供给、需求与房价的历年数据以及其影响因素的数据分别作为学习样本,建立预测模型,进行预测。关键词:BP 神经网络;住宅市场;时间序列;回归预测; 一:问题的提出与重述华尔街金融风暴越演越烈,日本、欧洲一些国家都出现了经济衰退,世界经济增速放缓,悲观的情绪在市场上蔓延,国际经济环境的剧烈变化使中国经济正经受着严峻的挑战和重大考验。随着金融危机对国内的影响的不断加深,物价,粮食,原油价格不断上升,股市处于低迷状态。过去这两三年里,楼价节节攀升的消息不断传来,到2008年厦门
3、楼市均价10000元/m2。今年以来,厦门楼市由冷转暖,高性价比楼盘大受欢迎,商品住宅总成交量出现暴涨,楼市再现排队抢房现象,这或许是深度调整后的集中爆发。结合当前国际国内金融形势,通过2001年-2008年实际数据,预估未来五年厦门楼市走势,并给购买者一个建议。 二:模型的符号约定与说明zi: 神经元的第i个输入;: 神经元的阈值;Y1: 人均居住使用面积(平方米); Y2: 市区人口总数(万人); Y3: 人均可支配收入(元); Y4 : 人均消费性支出(元); Y5 : 住宅平均售价(元/平方米); Y6 : 房地产开发投资(亿元); Y7: 地区生产总值(亿元); Y8 : 贷款利率(
4、%); Y9 : 住宅销售面积(平方米); E: 测试集网络输出和目标的误差; : 输出层第k个神经元与隐含层第j个关联度 : 输出层第j个神经元与隐含层第i个关联度 : 输入量: 输出量: 隐含层节点数: 输入层节点数m : 输出层节点数 : 隐含层激活函数Mse: 均方误差 : 学习率; a : 动量因子goal: 收敛误差界值;三:模型的分析BP 神经网络是目前神经网络中使用最为广泛的网络模型,它无论在网络理论还是网络性能方面都已经非常成熟,其突出的优点就是具有很强的非线性映射能力和柔性的网络结构。现实世界中的许多问题,如模式识别、图像处理、系统辨识、函数拟合、优化计算、最优预测等,都可
5、以转换成这种神经元网络来处理,因而BP 网络的应用范围较为广泛。3. BP 神经网络应用于预测的原理及步骤3.1 BP 神经网络应用于预测的原理BP 神经网络用于预测的基本原理是:建立一个神经网络,用历史数据来训练神经网络,通过神经网络的自学习、自适应来调整网络的连接权的权值去逼近预测对象与预测变量之间的非线性关系,各因子的权重隐含在神经网络的权值中而无需人工干预。经过训练的神经网络提取了蕴藏在样本中的非线性映射关系,并以权值的分布形式储存起来。在预测阶段,当向神经网络输入与训练集数据(非样本)相似的预测变量数据时,它便能完成从输入的预测变量到输出的预测对象的任意非线性映射,从而正确描述无法用
6、数学关系来描述的预测变量与对象之间的规律。在一定的误差容限内,还可以处理非完全的数据。3.2 BP 神经网络应用于预测的步骤BP 神经网络用于预测有三种方式:趋势预测、回归预测和组合预测。本研究的目的就是在现有的数据条件下,采用BP 神经网络趋势预测和回归预测的思路,把厦门市房地产住宅市场的供给、需求与房价的历年数据以及其影响因素的数据分别作为学习样本,通过BP神经网络分析厦门市房地产住宅市场的供给、需求、房价与其影响因素之间的关联关系,然后预测厦门市房地产住宅市场未来的发展情况。具体步骤如下:3.2.1 输入变量的分析与预处理一般将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型效
7、果会更好,训练也更方便。为使网络训练更加有效,对神经网络的输入、输出数据进行一定的预处理可以加快网络的训练速度。Matlab提供的预处理方法有归一化处理、标准化处理和主成分分析。常采用的是归一化处理,即将输入、输出数据映射到 - 1, 1 范围内,训练结束后再反映射到原数据范围。3.2.2.BP 神经网络结构设计(1)网络层数的确定理论上证明:具有偏差和至少一个S 型隐层加上一个线性输出层的神经网络,能够逼近任何有理函数。本文预测模型采用三层神经网络,即输入层隐层输出层结构。大多数通用的神经网络都预先预定了网络的层数,而BP网络可以包含不同的隐层。但理论上已经证明,在不限制隐含节点数的情况下,
8、两层(只有一个隐层)的BP网络可以实现任意非线性映射。在模式样本相对较少的情况下,较少的隐层节点,可以实现模式样本空间的超平面划分,此时,选择两层BP网络就可以了; 当模式样本数很多时,减小网络规模,增加一个隐层是有必要的,但是BP网络隐含层数一般不超过两层。(2)隐层单元数的确定有关研究证明,网络训练精度的提高,可以采用一个隐层,而增加其神经元数量的方法来实现,这比增加网络隐含层数的方法简单的多。(3)初始权值的选取置隐层节点的初始值为均为分布在零附近的很小的随机值。置输出层节点所连的权值数的一般为+1,另一半为-1。网络节点的偏置()统一设置为零。(4)响应函数(传输函数)的选取由于Sig
9、moid 函数的可微性,且微分式简单,易于表示,同时它又有很好的非线性映射能力,所以多作为映射函数。本研究采用了Sigmoid 激活函数。 对于每个节点 : 隐含层激活水平 : 隐层输出 : 输出层激活水平 : 输出层输出 : 则 : 3.3 训练算法及训练参数的选择针对不同的应用,BP网络提供了多种训练,学习方法,通常对于包含数百个权值的函数逼近网络,训练函数trainlm收敛速度最快。将RPROP算法的训练函数trainrp 应用于模式识别时,其速度是最快的。用变梯度算法的训练函数traincgf,在网络规模比较大的场合,其性能都很好。(1)训练算法的选择LM 算法适用于解决大、中规模问题
10、,尤其在解决大规模问题时,LM 算法有着突出的优点:一次迭代能使误差大幅度下降。本研究采用了LM 算法。(2)训练方式的选择神经网络的训练模式有两种:逐变模式和批变模式。在逐变模式中,网络输入每提交一次,梯度计算一次并更新权重。在批处理模式中,当所有的样本输入并计算其总的误差后网络权值才被更新。使用批变模式不需要为每一层的权重和阈值设定训练函数,而只需为整个网络指定一个训练函数,使用起来相对方便,而且许多改进的快速训练算法只能采用批变模式,在这里我们只讨论批变模式,以批变模式来训练网络的函数是train.(3)训练参数的选取BP 算法中几个常用的参数,包括学习率,动量因子a 及收敛误差界值go
11、al 等,这些参数对训练速度的影响很关键。3.4 网络训练与预测把输入样本输入到神经网络,计算网络输出值,然后与实际输出相比较,使用选定的网络训练算法,以一定的规则修改网络的连接权值。反复计算误差和修改权值,直到误差达到一定的范围以内,输入检验样本,判断检验结果;还原处理及结果分析,对样本结果进行还原处理得到实际值,如果训练误差在允许范围内,而且网络泛化能力较好,就可以利用训练好的BP 神经网络来预测房地产住宅市场的未来发展情况。四:模型的建立与求解4.1基于历年厦门住宅平均售价数据的 BP 网络预测模型4.1.1 预测步骤 由于激活函数一般为 sigmoid 函数,当自变量大于一定值后,函数
12、将趋近于 1 或者 0,随着自变量的增大或减小,函数值将变化不大。如果直接将实际数据作为神经网络的输入参数计算,将会使学习一开始就处于饱和状态,看不出不同样本的差别,无法进行调整。为了使输入样本对神经元的刺激有可比性,在学习之前,需要对样本数据作预处理,通常使把样本值换成0, 1或者-1,1范围内的数据,这一过程就是前面讲的归一化处理。使 BP 网络的输入输出值限制在区间0.2,0.9之间,然后在输入网络进行计算。具体算法如下: (1)归一化处理,使所有数据的值处于0.2,0.9之间。 原始数据表如表 1 所示,归一化后的数据表如表 2 所示。 表 1 2001年2008年厦门市住宅实际平均售
13、价数据表 年份平均售价(元/m2)年份平均售价(元/m2)20012558200547442002259520066601200331372007890720043768200810000 表 2 2001年2008年厦门市住宅实际平均售价归一后数据表年份平均售价年份平均售价20010.220050.405620020.203520060.580320030.254520070.797220040.318820080.94.1.2 住宅平均售价预测结果分析 预想达成以下目的: (1)考察 BP 网络对住宅平均售价的预测效果。 (2)考察是否能够用一个训练好的网络来根据历年住宅实际平均售价数据来
14、预测住宅平均售价。如果能,那么说明历年收入数据具有一定的相关性。 A:预测网络输入节点的确定 依据 2001年到 2008 年获得的住宅实际平均售价数据,拟建一个有 2个输入节点的三层网络。这 2个节点依次为历年住宅实际平均售价。 B:隐含层的考虑 根据Hornik 提出的公式:求得。其中,n 为输入层节点数,m 为输出层节点数。根据公式,确定隐层节点数的取值范围为25,但是最佳的隐节点数要通过实验测试。本文采用Matlab6.5 的BP 神经网络工具箱进行仿真实验,实验中参数取值:goal=0.1,epochs=5000,=0.6。通过多次实验确定隐含层最佳个数为3。 C.训练及结果分析 在
15、训练时训练函数设为 trainlm,学习函数设为 learngdm,传递函数设为purelin。训练步数为 5000 步,训练精度为 0.1。训练收敛的极快,多次训练过程中保持网络训练函数、学习函数、传递函数均不变。训练的最佳效果收敛图以及预测图如图3、图4所示。图3 预测收敛图 图4 结果预测图训练多个网络后, 从图中可以看到能够达到预期的预测效果。 当训练好一个网络,该网络能较准确的预测农民收入。分析能够训练好网络有以下两种可能: A: BP网络数据拟合能力强,不需要采取其他方法增强网络的数据拟合能力。 表3 真实值与预测值的比较年份预测值真实值误差误差率20053900.84744843
16、.20.17820066836.96601235.90.036200710486.889071579.80.177200810494100004940.049从上表可看出,误差都在允许的误差范围内,这样的网络结构获得了较好的拟合效果,预测值和实际值之间的误差也比较小。从某种程度上依然可以预测 2009年、2010年、2011年、2012年、2013年厦门住宅平均售价情况。 B:历年厦门住宅平均售价相关性强。根据历年厦门住宅平均售价变动趋势,可预测 2009年、 2010年、2011年、2012年、2013年厦门住宅平均售价。所得预测结果见表4。 表4 预测结果年份预测值(元/m2)年份预测值(
17、元/m2)200910494201210494201010494201310494201110494从预测结果表明,在不考虑其他因素的影响,未来5年厦门住宅平均售价处于一个比较平稳的趋势,不会发生很大的变动。 4.1.3 预测程序的编写过程 用 MATLAB 建立模型,实现预测的程序见附录一。 4.2 基于影响厦门住宅销售平均价格因素的 BP 网络预测模型4.1.1 预测步骤 (1) 指标的选取 由于影响住宅市场的因素众多,同时部分影响因素具有不可量化的特性。该模型在使用 BP 神经网络对住宅市场进行预测时,选取输入变量时充分考虑了其代表性以及指标之间的相关性,同时结合可量化的原则,选用的影响
18、因素指标为人均居住使用面积、市区人口总数、人均可支配收入、 一年贷款利率利率、人均消费性支出、房地产开发投资、地区生产总值、住宅销售面积这八大指标。 (2)预测模型的网络结构图如下图5所示。 图5 预测模型网络结构图原始样本数据如表 5 所示 表 5 原始数据表年份2001年2002年2003年2004年2005年2006年2007年2008年住宅平均售价(元/平方米)255825953137376847446601890710000人均居住使用面积(平方米)18.4718.3119.5921.4921.3622.9323.9424.1市区人口总数(万人)134.36137.16137.161
19、41.76146.77153.22160.38167.78人均可支配收入(元)11364.9611767.6812915.1614442.6716402.7518513.1721502.5823948人均消费性支出(元)8490.248503.89458.7110738.6811848.9314162.2616380.2317117住宅平均售价(元/平方米)255825953137376847446601890710000房地产开发投资(亿元)56.6362.3379.2791.48114.07213.93345.74323.96地区生产总值(亿元)558.33648.36759.69887.
20、711006.581168.021387.851560.02贷款利率(%)5.335.315.315.585.585.9856.937.065住宅销售面积(平方米)21530731867448217125525504522723155209497836955701696400资料来源:20012007 年厦门经济特区统计年鉴,2008年数据来自中经网。 经过归一化处理后的数据表如表 6 所示。 表 6 归一化后的数据表年份2001年2002年2003年2004年2005年2006年2007年2008年人均居住使用面积-0.9447-1.0000-0.55790.09840.05350.5959
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BP 神经网络 厦门 楼盘 走势 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。