随机微分博弈模型中的库存管理问题:马尔可夫链近似和最优策略.pdf
《随机微分博弈模型中的库存管理问题:马尔可夫链近似和最优策略.pdf》由会员分享,可在线阅读,更多相关《随机微分博弈模型中的库存管理问题:马尔可夫链近似和最优策略.pdf(15页珍藏版)》请在咨信网上搜索。
1、Advances in Applied Mathematics 应用数学进展应用数学进展,2024,13(4),1827-1841 Published Online April 2024 in Hans.https:/www.hanspub.org/journal/aam https:/doi.org/10.12677/aam.2024.134172 文章引用文章引用:欧君恒,卢相刚.随机微分博弈模型中的库存管理问题:马尔可夫链近似和最优策略J.应用数学进展,2024,13(4):1827-1841.DOI:10.12677/aam.2024.134172 随机微分博弈模型中的库存管理问题随机
2、微分博弈模型中的库存管理问题:马尔可夫链近似和最优策略马尔可夫链近似和最优策略 欧君恒欧君恒,卢相刚卢相刚 广东工业大学数学与统计学院,广东 广州 收稿日期:2024年3月28日;录用日期:2024年4月23日;发布日期:2024年4月30日 摘摘 要要 本文本文研究了在随机参考价格影响下,研究了在随机参考价格影响下,两个两个垄断厂商垄断厂商竞争下竞争下的生产和定价策略。的生产和定价策略。设定的设定的库存管理系统包括库存管理系统包括随机参考价格和随机需求。在随机参考价格和随机需求。在随机微分博弈模型的随机微分博弈模型的框架下研究了库存管理问题,框架下研究了库存管理问题,我们给出该背景下支付我们
3、给出该背景下支付函数的定义函数的定义。为了得到最优生产和定价,。为了得到最优生产和定价,我们我们采用动态规划原理采用动态规划原理的方法的方法,博弈的上下值满足一个耦合的博弈的上下值满足一个耦合的非线性积分微分非线性积分微分Hamilton-Jacobi-Isaacs(HJI)方程组方程组。本文还证明了该对策问题鞍点的存在性,本文还证明了该对策问题鞍点的存在性,由于很由于很难得到封闭形式的解,我们采用马尔可夫链近似难得到封闭形式的解,我们采用马尔可夫链近似来近似值函数和最优控制来近似值函数和最优控制,并给出了收敛性分析。最后,并给出了收敛性分析。最后,我们进行了数值实验我们进行了数值实验,并且,
4、并且根据实验结果,提出了相应的管理建议。根据实验结果,提出了相应的管理建议。关键词关键词 库存控制,随机需求与参考价格,马尔可夫链近似,随机微分对策库存控制,随机需求与参考价格,马尔可夫链近似,随机微分对策 Inventory Management Problems in Stochastic Differential Game Models:Markov Chain Approximation and Optimal Policies Junheng Ou,Xianggang Lu School of Mathematics and Statistics,Guangdong Universi
5、ty of Technology,Guangzhou Guangdong Received:Mar.28th,2024;accepted:Apr.23rd,2024;published:Apr.30th,2024 Abstract This paper investigates the production and pricing strategies employed by two monopolies in a 欧君恒,卢相刚 DOI:10.12677/aam.2024.134172 1828 应用数学进展 competitive environment,considering the i
6、nfluence of random reference prices.The inventory man-agement system incorporates both random reference prices and random demand.The problem of inventory management is examined within the framework of a stochastic differential game model,with the payment function defined accordingly.To obtain optima
7、l production and pricing decisions,dynamic programming principles are utilized,and coupled nonlinear integral differential Hamil-ton-Jacobi-Isaacs(HJI)equations that govern the upper and lower values of the game are established.Furthermore,the existence of saddle points for this game problem is prov
8、en.Due to challenges in ob-taining closed-form solutions,Markov chain approximation is employed to approximate functions and optimal controls while providing convergence analysis.Finally,numerical experiments are con-ducted to validate our findings,leading to corresponding managerial recommendations
9、.Keywords Inventory Control,Stochastic Demand and Reference Price,Markov Chain Approximation,Stochastic Differential Game Copyright 2024 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/license
10、s/by/4.0/1.引言引言 库存管理在供应链中起着至关重要的作用,直接塑造了公司的运营效率和财务业绩。随着市场竞争的日益激烈,有效地管理和优化库存已成为企业获得竞争优势不可或缺的因素。自从 Whitin 发表了关于库存问题的稳定需求曲线模型以来,众多学者一直致力于探索如何更有效地降低公司的管理成本,以实现利润最大化1。Bertsimas 和 De Boer 研究了一个周期性的多产品定价和库存控制问题,考虑了生产和定价收入的影响作为影响因素,进一步深入研究了库存控制的利润模型,得出了更符合实际的结果2。Chen 等人将这个问题扩展到动态定价和动态生产环境中的库存控制,考虑了可变条件对最大化预
11、期长期利润的影响3。值得注意的是,在上述研究中,参考价格效应作为影响消费者购买意愿的关键因素并未得到足够的重视,这在研究动态定价和生产问题时显然是不合理的。Greenleaf 强调了参考价格效应对公司盈利能力的重要影响4。这种现象表现为,如果销售价格低于参考价格,买家会感觉利润并增加购买欲望;相反,如果销售价格高于参考价格,买家会感觉亏损,导致购买欲望下降。Hu 等人从长期角度关注动态销售定价的整体收入,考虑消费者囤积行为,但没有探讨库存方面5。Chen 等人进一步考虑了库存的影响,系统地将参考价格效应引入动态库存控制问题6。通过一种新的转移方法,得到了一个凹形的长期期望收益函数,解释了最优基
12、本库存水平和目标参考价格对当前参考价格的依赖性。Chen 等人假设参考价格是一个固定值;然而,将参考价格的可变性视为随机和客户感知的波动似乎更现实6。因此,在此基础上,我们引入了随机参考价格的概念。参考价格受顾客的主观感受影响,受商品平均价格、折扣、品牌效应等因素影响,具有明显的记忆性。Chen 等人认识到参考价格的随机性和无限连续时间演化下的最优定价,推导出明确表达的最优定价策略7。受此启发,Cao 和 Duan 首次将随机参考价格引入库存问题,分析了基于不确定需求和参考价格的随机最优库存控制8。最优定价与库存水平负相关,与参考价格水平正相关。制造商利用参考价格效应,根据客户记忆参数确定价格
13、,调整库存水平以控制运营成本,同时确保正常出货水平被视为最佳控制。在上述研究中,研究人员经常假设制造业处于垄断地位;然而,在现实中,涉及两家或两家以上公Open AccessOpen Access欧君恒,卢相刚 DOI:10.12677/aam.2024.134172 1829 应用数学进展 司的竞争是普遍存在的。寻求更低的经营风险和占领更多的市场份额已成为企业的重点。公司必须考虑降低其运营风险,同时最大限度地减少竞争对手风险的影响。Pang 和 Fukushima 提出了一个多领导者和追随者的竞争市场模型,其中不存在合作,建立了风险变化下的奖惩机制9。Elliott 和 Siu 考虑了在零和
14、博弈背景下进行风险预测的必要性,通过有限马尔可夫链预测市场变化下的消费者选择变化10。Adida和 Perakis 将上述研究应用于更现实的情景,设想两个公司在市场上竞争,寻求获得对方的市场份额以获得垄断优势11。一家公司的决策影响另一家公司的市场决策,遵循纳什均衡。随着时间的推移,两家公司都寻求通过动态定价和库存控制来提高竞争力,从而实现利润最大化。尽管研究人员试图尽可能真实地模拟该模型,但他们没有考虑参考价格对消费者购买意愿的重大影响。考虑到参考价格和消费者购买意愿之间的密切相关性,理解公司产品的市场竞争力应该包括考虑消费者的看法。为了获得更真实的结果,将随机参考价格的影响纳入博弈模型是必
15、要的。这个模型福尔斯一个追逐逃避博弈,是一种定性微分博弈。Berkovitz 和 Dresher 使用变分方法显式求解了战争模型中的追逃博弈的最优解问题,提供了一种使用微分方程求解最优控制的方法12。Fleming 专注于有限连续时间微分对策的收敛性,进一步描述了在预定初始条件下的对策解13。Elliott和 Kalton 提出用微分方程组来求解零和动态对策,并分析了微分对策中值的存在性14。Jin 等人引入了两家保险公司之间利润再投资的博弈场景,使用状态转移模型来捕捉环境不确定性的变化15。它们之间的竞争,可以用微分方程来分析。考虑到 Hamilton-JacobiIsaacs(HJI)方程
16、组很难得到封闭解,利用马尔可夫链近似观察盈余变化,预测动态规划中鞍点的存在性。马尔可夫链方法在博弈模型中的应用,显著地强调了近似结果在决策预测中的关键作用。采用马尔可夫链近似有助于处理模型中的非均匀可分析分段函数所带来的挑战。最初,Pan 和 Basar 研究了状态跳跃下的不完美测量方案,提出了一种当系统函数呈现分段特征时使用离散时间马尔可夫链进行近似的方法16。Yin 等人继续了 Pan 和 Basar 的方法,通过研究奇异摄动马尔可夫链来解决离散时间中大规模复杂系统的控制优化问题,显着降低了系统的复杂性17。受 Jin 等人的启发,他们使用马尔可夫链近似来构造离散时间控制的马尔可夫链以获得
17、最优解,我们将马尔可夫链近似应用于解决企业中库存控制和产品运营的博弈问题15。建立了考虑参考价格影响的定价与库存控制模型。在该模型中,企业的初始品牌价值和利润收入不相等,市场需求不确定,消费者对两家企业产品的记忆参数不同,初始参考价格也不同。企业可以在连续的时间内随时调整自己的经营策略,寻求挤压竞争对手的市场份额,直到它们之间的利润差距扩大或缩小到一定值。这表明一家公司无法再挑战另一家公司的市场地位,该模式停止。本文的主要贡献如下:(1)本文首次利用马尔可夫链近似方法求解了两个公司在参考价格作用下的联合生产定价模型的随机最优控制问题。(2)进行了数值实验,我们对得到的结果给出分析和管理的见解。
18、其余的工作组织如下:在第 2 节中,我们提出了两个制造商公司竞争下的随机微分对策的一般形式和假设。在第 3 节中,我们讨论了马尔可夫链近似方法的数值算法。用近似马尔可夫链很好地逼近了博弈的上、下界,并给出了动态规划方程。在第 4 节中,我们讨论了近似格式的收敛性。证明了鞍点的存在性。最后,在第 5 节中,我们进行了数值实验,并给出了我们的结果。在此基础上,对数值模拟结果进行了合理的分析和讨论,并给予相应的管理意见。2.模型模型 我们使用一个随机微分方程来表示公司 1 的参考价格:欧君恒,卢相刚 DOI:10.12677/aam.2024.134172 1830 应用数学进展 ()()()()(
19、)()()()()()()111111dRtp tRtdtRt dYt=+(1)平方根扩散项()()()11Rt表示随机参考价格的波动性。这里,()1为参考价格的波动性参数。参考价格的内存参数或调整速度用表示。制造公司 1 的累积消费者需求()()1Dt是一个随机过程,由:()()()()()()()()()1111,0dDtabp tRtp tdtdW tt=+(2)潜在需求的波动性参数用()1表示,维纳过程()()1Wt仍然与()()1Yt保持不相关。库存的连续时间动态受生产率和需求率之间的相互作用的控制,遵循一个随机微分方程:()()()()()111dXtut dtdDt=(3)考虑到
20、公式(2),上述库存动态变为:()()()()()()()()()()()()()()1111111,0,0.dXtutabptRtptdtdW tXxt=+=(4)假设连续时间公司盈利过程包括价格()1p t、需求率()1D t、生产成本()()1C u t和库存成本()()()1H Xt,它满足随机微分方程:()()()()()()()()()()()11111dZtp t dDtC u tH Xtdt=+(5)考虑到(2),制造公司 1 的剩余过程可以写为:()()()()()()()()()()()()()()()()()()()()()()()()()()()()1111111111
21、111111,0,0dZtp tabp tRtp tp tabp tRtp tC utH Xtdtp tdWtZzt=+=同样,与制造公司 1 竞争的制造公司 2 也出现了随后的盈余()()()()()()()()()()()()()()()()()()()()()()()()()()()()2222222222222222,0,0.dZtptabptRtptptabptRtptC utH XtdtptdWtZzt=+=在本研究中,我们将描述两家制造企业之间的竞争。这两家公司的表现是通过其盈余()()12ZZ的差值来衡量的。在不失一般性的前提下,我们假设()()12ZZ。盈余越大的公司努力扩大
22、盈余差距,而盈余越小的公司则努力减少盈余差距,使差距最小。因此,这两家公司之间的竞争形成了一个双人游戏,每个参与者都可以根据其生产和定价策略来响应其竞争对手的策略。设()()()12Z tZZ=。因此,两个盈余()Z t的差异由以下动态控制:()()()()()()()()()()()()()()()()()()()()()()()()()()()()1111121222121122,0,0.dZ tp tabp tRtp tC utH XtptabptRtptp tdWtptdWtZz t=+=(6)其中()()12zzz=。为了更好地研究公司 1 和公司 2 的需求过程之间的关系,我们假设
23、公司 1 和公司 2 的累积需求过程之间存在相关性。设为()()1W与()()2W、()1,1 之间的相关系数。通过这种方式,我们可以将()()2W重写如下:()()()()()()()21221dWtdWtt dWt=+(7)()()2W是一个标准的布朗运动,并且独立于()()1W。我们允许将盈余以价格投资于金融市场上的资产()M t,为资产的收益率,3为相应的波动率,()()3Wt为标准布朗运动。并且我们假设它满足以下形式:欧君恒,卢相刚 DOI:10.12677/aam.2024.134172 1831 应用数学进展 ()()()()33dM tdtdWtM t=+(8)因此,结合(7)
24、和(8),我们可以将等式(6)改写如下:()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()111111222222122221122331dZ tZ tp abp tRtp tC u tH XtptabptRtptC utH Xtdtptp tdWtptdWtZ t dWt=+(9)为了简化过程,我们将在下面用 6 维的形式来表示它:()()()()()(),dL tf L ttdtL tdW=+()()()()()()()()()()()1212,L tZ tXtXtRtRt=,()12345,Tfff
25、fff=,()()()()()()()()22211223121122100000000000000000000000ptp tptZ tRtRt=()()()()()()()()()()()()12312,W tWtWtWtYtYt=,和1f,2f,3f,4f,5f具有以下形式 ()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()11111112222221211123222141252()()fZ tp tabp tRtp tC utH XtptabptRptC
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 微分 博弈 模型 中的 库存 管理 问题 马尔可夫链 近似 最优 策略
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。