基于1_t-Polyak步长的随机控制的随机梯度算法.pdf
《基于1_t-Polyak步长的随机控制的随机梯度算法.pdf》由会员分享,可在线阅读,更多相关《基于1_t-Polyak步长的随机控制的随机梯度算法.pdf(10页珍藏版)》请在咨信网上搜索。
1、Advances in Applied Mathematics 应用数学进展应用数学进展,2024,13(3),1008-1017 Published Online March 2024 in Hans.https:/www.hanspub.org/journal/aam https:/doi.org/10.12677/aam.2024.133095 文章引用文章引用:刘晨晨.基于 1/t-Polyak 步长的随机控制的随机梯度算法J.应用数学进展,2024,13(3):1008-1017.DOI:10.12677/aam.2024.133095 基于基于1/t-Polyak步长的随机控制的随
2、机梯度算法步长的随机控制的随机梯度算法 刘晨晨刘晨晨 河北工业大学理学院,天津 收稿日期:2024年2月27日;录用日期:2024年3月21日;发布日期:2024年3月27日 摘摘 要要 随机梯度下降算法已成为求解大规模有限和优化问题的流行算法,然而,由于其在迭代过程中会产生方随机梯度下降算法已成为求解大规模有限和优化问题的流行算法,然而,由于其在迭代过程中会产生方差,导致了振荡现象。随机控制的随机梯度差,导致了振荡现象。随机控制的随机梯度(SCSG)算法缩减了该方差,但算法缩减了该方差,但SCSG算法对于步长有较强的限算法对于步长有较强的限制。为了扩大制。为了扩大SCSG算法的步长选择范围,
3、基于算法的步长选择范围,基于1/t-带步长与带步长与Polyak步长步长,提出提出1/t-Polyak步长步长,并将其并将其与与SCSG算法结合算法结合,提出提出SCSGP算法。建立了算法。建立了SCSGP算法在强凸条件下的线性收敛性,数值实验表明算法在强凸条件下的线性收敛性,数值实验表明SCSGP算法与其算法与其他他随机梯度类算法相比有明显优势随机梯度类算法相比有明显优势。关键词关键词 有限和优化,随机算法,方差缩减,有限和优化,随机算法,方差缩减,1/t-带步长带步长 1/t-Polyak Stepsize for the Stochastically Controlled Stochas
4、tic Gradient Algorithm Chenchen Liu School of Sciences,Hebei University of Technology,Tianjin Received:Feb.27th,2024;accepted:Mar.21st,2024;published:Mar.27th,2024 Abstract The stochastic gradient descent algorithm has become popular algorithm for solving large-scale finite-sum optimization problems
5、.However,this algorithm leads to oscillations due to the va-riance in the iterative process.The stochastically controlled stochastic gradient(SCSG)algorithm reduces this variance,but the SCSG algorithm has strong limit on stepsize.To expand the range of stepsize selection of the SCSG algorithm,we pr
6、opose 1/t-Polyak stepsize by combining the 1/t-band stepsize and the Polyak stepsize.Using this new stepsize for the stochastically controlled stochas-tic gradient(SCSG)algorithm,the SCSGP algorithm is proposed.We establish the linear conver-gence rate of SCSGP for strongly convex problems.Numerical
7、 experiments demonstrate a clear 刘晨晨 DOI:10.12677/aam.2024.133095 1009 应用数学进展 advantage of SCSGP over other stochastic gradient algorithms.Keywords Finite-Sum Optimization,Stochastic Algorithms,Variance Reduction,1/t-Band Stepsize Copyright 2024 by author(s)and Hans Publishers Inc.This work is licen
8、sed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 考虑有限和优化问题:()()11mindnixif xfxn=,(1)其中分量函数()ifx连续可微,假设()f x是强凸的。机器学习中满足条件的优化问题有很多,例如带2?正则项的逻辑回归问题和带2?正则项的最小平方回归问题等1 2 3。当数据规模过大时,随机梯度下降(SGD)算法4是求解问题(1)的主流算法,即用随机梯度估计全梯度,其迭代格式为(
9、)1ttttitxxfx+=,其中0t是步长,()titfx是分量函数()tifx在tx处的梯度。随机梯度()titfx与全梯度()tf x之间的方差导致 SGD 即使在强凸条件下,也只能达到次线性收敛速度5。方差缩减梯度(SVRG)算法6通过内外两层循环达到缩减方差的目的,但由于其在外循环中需要计算全梯度且内循环次数较大,导致数据规模过大时计算量大。为了改善这个问题,SCSG 7令内循环次数服从几何分布且在外循环中计算批量梯度()1tii ItgfxI=?,其中 tIn,tI为tI的批量大小,x?为在外循环中设置的快照点。在内循环中,SCSG 用与 SVRG 相同的格式更新梯度估计量:()(
10、)tttitigfxfxg=+?。在强凸条件下,其使用固定批量可线性收敛到解的邻域。SCSG 适用于求解大规模4910,10n、低精度4210,10的优化问题7 8 9,可以经过很少的有效循环次数收敛到上述目标精度。步长是保证随机梯度类算法收敛的关键因素,很小的常数步长和衰减步长都会使算法收敛缓慢,并且手动调整常数步长的过程相当耗时10 11 12。Polyak 步长13利用迭代过程中产生的函数值和梯度自动地计算步长,避免了手动调整的过程,其计算公式为()()*22tttf xff x=,其中*f是()f x的极小值。为了将 Polyak 步长与随机梯度类算法结合,Loizou 等人14提出
11、Polyak 步长的随机版本(SPS):Open AccessOpen Access刘晨晨 DOI:10.12677/aam.2024.133095 1010 应用数学进展 ()()*22tttitititfxffx=,其中*tif是()tifx的极小值。SGD 结合 SPS 步长比结合固定步长数值表现好。当 SPS 步长中*tif不易求解时,可用一个下界*ttiif?来替换15。最近,Wang 等人16介绍了 1/t-带步长,其允许步长在一定范围内扰动,具体格式为 tmMtt,1t,其中mM是正常数。显然,衰减步长0tt=是 1/t-带步长的特殊情况。受1/t-带步长和Polyak步长启发提
12、出1/t-Polyak步长,并将其与SCSG结合提出新的算法SCSGP。在强凸光滑的条件下,SCSGP 结合变化的批量可达到线性收敛速度。数值实验结果表明 SCSGP 比 SCSG及其他随机梯度类算法表现好。论文其余部分概括如下:在第 2 部分中提出 1/t-Polyak 步长并描述 SCSGP 算法。收敛性分析在第 3部分。在第 4 部分中设置了数值实验。最后在第 5 部分进行总结。2.1/t-Polyak 步长与步长与 SCSGP 算法算法 首先,利用 Polyak 步长的随机版本并将其与 1/t-带步长结合,提出 1/t-Polyak 步长:,;,;,PtPPtttPtm tm tm t
13、M tM tM t=,则对任意满足tND 的序列nD有()()1011tttNNNtDDDD+=,其中 E 记为对所有随机变量取期望。记mintt=,则对任意 tT有()()101E1tttNNNDDDD。(4)为了应用(3),需要证明用到的相关序列nD满足tND。下面引理保证了该性质。引理引理 2 假设()ifx是 L-光滑的,令2 313ttbMLtB且8ttBb,则对任意1t,21ttxx?,()*tf xf?,()2tf x?,1,ttte xx?,(),ttef x有222,aa bc bc+,令2c=,则有()()()221,4ttttktkttefxfxe+。(6)因为tMt,2
14、 313ttbMLtB且8ttBb,可知304tL。由(5)和(6)得到()()()()()()()()()221320113344.324kttttkkktIttttttkttLf xf xf xeLLLxxbL+?(7)注意到()()()1kktttktxxv+=,用类似(5)的推导过程可得()()()()()()()()()()()()()()()()()()()()()()()()()()()2222100022200022200022222,2,2,12,2,22.kkkkkktkktkIIIktkkttttttttktkItktkttttttttttttkttkttttttttkt
15、txxxxvxxvxxf xxxe xxvLxxf xxxe xxbf xe+=+=+?(8)再次使用222,aa bc bc+并取28tttbcB=,则有()()()()()()()()2220082,8tttttttttkkkttktBbf xxxf xxxbB+,()()()()2220082,8ttttttttkttkttBbe xxexxbB+。将上述不等式和(7)代入(8)得到()()()()()()()()()()22332222210013288112142283 44.33 4kkttttttttttkkttItttttttttttkktttIbLL B bBLxxxxeBb
16、LbLB bf xf xL+?(9)由2 313tttbLB和8ttBb可得()()()()()()()()()4 322332 33 43 43 4 11 68 27328221 31128 27741.21442142ttttttttttttttttttb Bb BLL B bbLbb BBBbBB+=刘晨晨 DOI:10.12677/aam.2024.133095 1013 应用数学进展 结合上式和(9)有()()()()()()()()()()()()()()()()()2 322221002 312 3222011 3781214241 3281 313211221132443 43
17、 4kktttttttttkkttItttttttttttkkItttttttktttttb BbbBxxxxeBBbb BB bf xf xb BbBBxxeBbb+?()()()()()1.ktttkkIf xf x+?(10)为了证明()()*tkf xf和()()210ttkxx+的上界,记()()()()()2*0123.tttttktkktBGf xfxxb=+对(10)取全期望得到()()()()()()222102222013212124413212112441321211.244ttttttkkktttttttkttttktttttttbBGGxxeBbbBGeBbbBGeB
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 _t Polyak 步长 随机 控制 梯度 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。