基于改进鲸鱼优化支持向量机的Airbnb住宿价格预测.pdf
《基于改进鲸鱼优化支持向量机的Airbnb住宿价格预测.pdf》由会员分享,可在线阅读,更多相关《基于改进鲸鱼优化支持向量机的Airbnb住宿价格预测.pdf(5页珍藏版)》请在咨信网上搜索。
1、 2023 年第 10 期89计算机应用信息技术与信息化基于改进鲸鱼优化支持向量机的 A i r b n b住宿价格预测金珊羽 1 JIN Shanyu 摘要 为了在有限样本条件下,建立高精度支持向量机预测的不确定性模型,并进一步提高预测的精度,提出一种基于改进的鲸鱼算法优化支持向量机的不确定性预测模型。所提出的模型基于 Airbnb 平台上市住宿价格的开源数据,将经过控制参数改进后的鲸鱼算法和支持向量机相结合,建立了 Airbnb 平台房价基准预测模型。通过与未改进的鲸鱼算法优化支持向量机预测模型和粒子群优化支持向量机预测方法对比,比较其在回归性能方面的四大评价指标,所建立的改进的鲸鱼算法优
2、化支持向量机模型在 MSE、MAPE、R2指标上分别优于其他两种方法。所得到的实验结果表明,在不确定因素较多的样本数据集上,经过改进的鲸鱼算法优化支持向量机模型可以更好地预测 Airbnb 平台房价基准,抗噪声能力更强且预测精度更高。关键词 鲸鱼优化算法;支持向量机;回归预测;机器学习;房价预测 doi:10.3969/j.issn.1672-9528.2023.10.0191.大连交通大学 辽宁大连 1160000 引言随着共享经济与“互联网+”的不断发展,群众对于浅经济的服务业越来越透明。除了日常的网购平台满足生活用品的基本需要,人们也从小程序或是集美食与娱乐的消费平台选择日常所需要的服务
3、,这种模式不仅仅透明化了消费价格,保障了市场的稳定,也能够让消费者们直观地了解到其他人的消费体验,同时作为消费者的我们也能真实地表达自己的体验感,为其他人的选择带来一些帮助。除了美食、娱乐的消费,日常出游的酒店及住宿选择也是比较重要的一部分,平台的集合性住宿不仅仅整合了松散的资源分布,同时更加方便有住宿需求的人们可以根据自己的需求选择不同的住宿场景。不同于传统的住宿形式,平台住宿可以与旅游业结合发展,在大数据的背景下更加准确地为消费者提供住宿帮助,这种住宿运营与发展相结合起来比较出色的平台之一是 Airbnb1。Airbnb 作为接待人数超于 5 亿房客、于全球 191个国家上线经营、整体房源
4、超过 600 万套的最大共享住宿平台,它被越来越多的房客选择与体验。Airbnb 采用了 C2C的运营模式,提升酒店住宿的丰富性,也打破传统的酒店选择的标准特征,更能体现其属性的丰富性。因此笔者选择Airbnb 作为研究对象,对其上市住宿中的纽约地区的数据进行统计,并应用于本文开发的改进鲸鱼算法优化支持向量机的预测模型进行该地的住宿行情估价,投入到实际使用中。支持向量机是由 Vapnik 等人提出的用于研究有限样本下机器学习规律的理论方法,随着支持向量机发展越来越成熟,其不完善的地方越来越突出,这部分内容仍需要进一步研究。参数的优化选择一直以来是支持向量机的一个研究热点。群智能算法在参数优化方
5、面具有较强的并行处理能力、寻优速度快,同时具有全局寻优等特点。使用群智能算法是当前支持向量机参数优化方法的研究前沿。对于优化支持向量机的群智能算法,不同学者进行了不同方向的研究,E Avci2和C.L.Huang3首次提出了基于遗传算法的支持向量机参数优化方法。王喜宾等人4提出了粒子群模式搜索算法来对 SVM 的参数进行优化。刘霞等人5也提出了一种基于混沌人工蜂群算法优化的 SVM 齿轮故障诊断方法。魏峻6提出了一种基于 ReliefF 和蝙蝠算法的 SVM 参数优化方法。本文在前人研究的基础上,采用鲸鱼优化算法(WOA)对支持向量机算法进行了改进,并对鲸鱼算法的本身结构进行改进优化,从而以更
6、高的精度实现对 Airbnb 平台房价的预测。1 支持向量机支持向量机(support vector machines),该算法在解决有限样本的理论统计,非线性高维特征下的识别表现优秀,弥补了其他机器学习相关算法的欠学习、过学习、陷入局部最小值的问题,并推广应用到函数拟合等其他机器学习问题中,在实际应用中主要用来解决拟合和回归估计问题。支持向量机回归的核心思想是在给定训练样本的基础上,希望学得一个回归模型,使得回归模型尽可能地接近基准模型,尽2023 年第 10 期90计算机应用信息技术与信息化可能地减小容忍值与损失函数。假定训练样本集 L 为:(1)式中:mi是样本实例,ni是 mi 相对应
7、的输出。设样本集在高维特征空间中的决策函数为:(2)式中:为超平面的权向量,b 为阈值。通过最小化结构风险原则和具备稀疏性的 不敏感损失函数,-SVM 模型在高维空间的目标函数可表示为如下的最优化问题。(3)式中:、是松弛变量,C 是惩罚系数,保持决策平面和误差之间的平衡。为了解决上述最优化问题,引入拉格朗日函数,并通过拉格朗日对偶可转化为对偶优化问题。(4)式中:、0 是拉格朗日乘子。通过求解对偶优化问题,得到相应的决策函数。(5)式中:为核函数。常用的核函数主要有:多项式核函数、高斯核函数、Sigmoid 核函数7。本文的研究是基于 Airbnb 平台房价数据进行建模,样本数且高于特征数,
8、并通过改进的鲸鱼算法对核函数的参数交叉验证进行寻优,因此相比于线性核与 Sigmoid 核,高斯核的特征维度更复杂、功能更强,更适用于本文的模型构建。2 鲸鱼优化算法及其改进2.1 鲸鱼优化算法为了在寻找问题最优解的过程中提升效率,以座头鲸的行为为启发,Mirjalili 等人8提出了一种新型的算法鲸鱼优化算法(whale optimization algorithm,WOA)。由于该算法的控制参数更少,跳出局部最优值的能力更强,而且操作简单,逐渐成为了各界学者的研究热点。WOA 数据源于座头鲸的狩猎行为,在座头鲸围捕猎物时,会根据自身的螺旋路径所形成的气泡完成狩猎,顾名思义这种行为模式称为气
9、泡网攻击。因此 WOA 算法的整个过程可以被分解为包围猎物、攻击猎物、搜索猎物三个阶段。(1)包围猎物在狩猎进行初期,因全域空间范围较大,最优解的位置属于未知态,因此 WOA 可假设最优解为攻击目标。根据最佳的攻击位置,其他的目标个体也可根据定义确定自己所在位置与范围。其表达式为:(6)(7)式中:t 为当前迭代次数,为当前最佳解的位置向量,Y 为鲸鱼个体的位置向量,P1为鲸鱼个体与猎物之间的距离,A和 C 为系数向量,用于控制鲸鱼的游走方式,其他变量的表示式为:(8)(9)(10)式中:m 为 0,1 的随机向量,a 为控制参数,Tmax为最大迭代次数。(2)攻击猎物为了模拟座头鲸的攻击行为
10、,设计了收缩和螺旋更新位置两种机制的数学模型。因为座头鲸在攻击猎物时,两种行为是同时进行的,为了模拟猎捕时的实际情况,假设座头鲸各 50%的概率进行更新位置,其数学表达式如下。(11)式中:P2为鲸鱼个体到猎物的距离,k用于定义对数螺旋形状,为一个常数,l 为-1,1 的随机数,h 为 0,1 的随机数。(3)搜索猎物在鲸鱼种群搜索猎物时,此阶段,种群进行全局探索。当|A|1 时,鲸鱼种群就会从猎物所在的位置分散开去,从而进入到寻找其他的局部最优解过程中去,增加搜索范围,保持种群的多样性。因此,此阶段的数学模型为:(12)(13)式中:Yrand表示从群体中随机选取的鲸鱼个体的位置向量;Pra
11、nd表示随机选取的鲸鱼个体到猎物的距离。2.2 改进鲸鱼算法由公式(8)可知,当|A|1 时,鲸鱼群体将扩大搜索范围寻找猎物,即全局搜索,收敛速度快;当|A|1 时,鲸鱼群体将收缩搜索范围对猎物进行攻击,即局部搜索,收敛速度慢。因此,A 的大小与 WOA 算法的全局搜索和局部搜索能力有很大关系。由公式(8)可以看出,A 随着控制参数 2023 年第 10 期91计算机应用信息技术与信息化a 的变化而变化,控制参数 a 是随着迭代次数从 2 线性递减到0,但是算法在不断收敛的过程中并不是线性的,由此可知,线性递减的控制参数 a 不能完全体现出实际的优化搜索过程。因此,本文提出了一种基于余弦规律变
12、化的控制参数,其修正表达式为:()()()()()()()()maxmaxmaxmax1cos111 221cos111 22nfinalinitialfinalnfinalinitialfinalttaaaattttaaaatt+=+=+(14)式中:ainitial和 afinal为控制参数 a 的初始值和最终值,本文取得 ainitial=2,afinal=0,t 为当前迭代次数,tmax为最大迭代次数,n 为递减指数,0n 1。a 的变化图如图 1 所示。图 1 控制参数变化图由图 1 可以看出,原始控制参数 a 的图像是线性递减的,在迭代过程中以相同的速率减小,而改进后控制参数 a
13、的图像是一条基于余弦规律变化的曲线。控制参数 a 在迭代初期减小得较慢,使得控制参数 a 较长时间保持较大值,从而使A 保持较大值的时间长些,以提高搜索效率;迭代后期减小的较快,使得 a 较长时间保持较小值,从而使 A 保持较小值的时间长些,以提高搜索精度。因此,该方法平衡了算法的全局搜索和局部搜索能力,维护了搜索的稳定性。3 基于改进 WOA 优化 SVM 的 Airbnb 平台房价的预测模型构建3.1 总体方案基于改进 WOA-SVM 的 Airbnb 平台房价的预测模型构建的主要包括以下几个步骤。首先,构建 Airbnb 平台统计的不同房型与价格的样本数据库;其次获得影响平台房价的关键影
14、响集合;再次,利用改进后的 WOA 算法对 SVM 参数进行优化,提高向量机的收敛速度,避免支持向量回归陷入局部最小值;最后,将关键影响因素集作为改进 WOA 的输入进行平台房价的预测。基于改进 WOA-SVM 的 Airbnb 平台房价的预测方法的总体方案如图 2 所示。图 2 基于改进 WOA-SVM 的 Airbnb 平台房价的预测方法的总体方案3.2 基于改进控制因子后的 WOA-SVM 算法流程如图 3 所示,仿真试验数据采用 Airbnb 平台房价数据集,在使用这些数据集前,首先需要将数据集的原始格式转换成为符合 LIBSVM 规范的数据格式,从规范后的数据里提取出训练数据集与测试
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 鲸鱼 优化 支持 向量 Airbnb 住宿 价格 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。