低秩Toeplitz张量的高精度随机填充算法.pdf
《低秩Toeplitz张量的高精度随机填充算法.pdf》由会员分享,可在线阅读,更多相关《低秩Toeplitz张量的高精度随机填充算法.pdf(16页珍藏版)》请在咨信网上搜索。
1、第 43 卷第 3 期2023 年 9 月数学理论与应用MATHEMATICAL THEORY AND APPLICATIONSVol.43No.3Sep.2023低秩 Toeplitz 张量的高精度随机填充算法温瑞萍*李文韦(太原师范学院数学与统计学院,晋中,030619)摘要本文基于高精度填充算法,考虑低秩 Toeplitz 张量填充问题的求解,通过在每步迭代中将张量随机地按第 n 模展开并且对它的奇异值分解(Singular Value Decomposition,简记作 SVD)进行修正,给出一种具有随机思想的高精度填充算法,并讨论其收敛性.通过对 Toeplitz 张量及 Toepl
2、itz 均值张量的数值实验,结果表明新算法比低秩 Toeplitz 张量的高精度填充算法在计算代价上有明显改进.关键词张量填充低秩 Toeplitz 张量随机算法Highaccuracy Randomized Completion Algorithm for theLow Rank Toeplitz TensorWen RuipingLi Wenwei(College of Mathematics and Statistics,Taiyuan Normal University,Jinzhong 030619,China)AbstractIn this paper,we consider th
3、e solution for the completion problem of low rank Toeplitz tensors,and basedonthehighaccuracycompletionalgorithm,presentahighaccuracycompletionalgorithmwithrandomizedtechnique,in which the nmode tensor is stochastically unfolded and the corresponding singular value decomposition(SVD)ismodified in ea
4、ch iteration.Moreover,the convergence of the new algorithm is established.The results of numericalexperiments on the Toeplitz tensor and the Toeplitz mean tensor show that the new algorithm is significantly betterthan the highaccuracy completion algorithm for low rank Toeplitz tensors in terms of co
5、mputational cost.Key wordsTensor completionLow rank toeplitz tensorRandomized algorithmdoi:10.3969/j.issn.10068074.2023.03.0051引言由于张量在多模态结构信息表中具有优势,所以对张量的研究成为近些年来的热点问题.一个已经引起学界高度关注的现象是:在张量数据的采集、存储、传输与处理等环节,常常会发生数据的丢失或腐蚀,因此张量数据的填充与恢复问题的研究就尤为重要.低秩张量填充问题作为低秩矩阵填充问题的推广,主要是根据已知的部分张量数据信息来填充其未知或缺失的数据.张量填充方山
6、西省回国留学人员科研项目(No.2022169),山西省科技创新人才团队重点项目(No.202204051002018),智能优化计算与区块链技术山西省重点实验室建设项目资助通信作者:温瑞萍(1965 ),教授,从事矩阵数据分析与科学计算研究 Email:收稿日期:2023 年 6 月 1 日96数学理论与应用法已经广泛应用于图像处理1、数据挖掘2、信号处理3及机器学习4等领域.低秩张量填充的数学模型一般为:minTrank(T),s.t.P(T)=P(C),(1.1)其中,C RI1I2In为待填充张量,T RI1I2In为 C 的低秩逼近张量,为基数为 m 的采样元素指标集,P()为相应张
7、量在指标集 上的正交投影,即P(T)=C(i1i2.iN),当(i1,i2,iN),0,当(i1,i2,iN)/.类似于矩阵填充的秩极小化模型,问题(1.1)属于非凸优化模型,是 NP 难问题.如果待填充张量 C的秩已知或容易估计,一些学者提出了类似于求解矩阵填充秩极小化模型的解法,但填充效果不甚理想.因而,在实际处理中,通常用逼近张量 T 的一个最紧凸包 T 来代替 rank(T),将问题(1.1)转化为下列凸优化模型,即张量填充的核范数极小化数学模型:minTT,s.t.P(T)=P(C),(1.2)其中 表示相应张量的核范数.求解(1.2)通常的作法是将张量按照不同的模展开成矩阵,对矩阵
8、进行填充操作后再折叠复原回张量形式.针对矩阵填充的核范数极小化问题求解,常见的经典算法有:Toh 等学者提出的加速近端梯度(APG)算法5 Cai 等提出的奇异值阈值(SVT)算法6 Lin 等提出的增广拉格朗日乘子(ALM)算法等7.因为张量的分解方式有 CP 分解、Tucker 分解、张量链分解、张量环分解和 tSVD 分解等8,所以张量填充问题的求解要比矩阵填充问题的求解复杂得多.根据各种分解,许多学者提出了求解问题(1.2)的有效方法.比如,Kolda 等提出了高阶 SVD 算法9.Gandy 等提出了采用 ADM 的框架求解低秩稀疏张量恢复问题10.Liu 等基于 Tucker 分解
9、提出了三种张量填充方法11:利用松弛技术,采用块坐标下降(BCD)方法求全局最优解的简单低秩张量填充算法(SiLRTC)将原非光滑问题转化为光滑问题,进而求解张量迹范数极小化问题的快速低秩张量填充算法(FaLRTC)在 SiLRTC 算法的基础上应用交替方向乘子方法的高精度低秩张量填充算法(HaLRTC).由于待填充矩阵往往具有特殊结构,Toeplitz 矩阵填充问题近年来受到许多学者的关注.比如,王川龙等提出了 Toeplitz 矩阵填充的均值算法12、修正的增广拉格朗日乘子算法13、保结构算法14、子空间算法15等.温瑞萍等提出了求解 Toeplitz 矩阵填充问题的逐步结构化增广拉格朗日
10、乘子算法16、l 步结构化增广拉格朗日乘子算法17、均值修正增广拉格朗日乘子算法18及尾端修正增广拉格朗日乘子算法19.同样地,在张量填充的某些应用问题中,虽然待填充数据表的规模很大,但是填充问题本身往往具有对称,Hankel 及 Toeplitz 等特殊结构,因而,结构化张量的填充和恢复在实际问题中的应用是很有意义且非常必要的.诸如,Badeac 等针对 Hankel 张量、对称张量、Toeplitz 张量填充问题分别提出了奇异值分解快速算法20 聂家旺等学者讨论了 Hankel 张量分解和秩,证明了 Hankel 张量的 CP 秩、对称秩及 Vandermonde 秩的一致性21 王川龙等
11、提出了一种快速且具有较高精度的 Hankel 张量填充算法22.低秩 Toeplitz 张量的高精度随机填充算法97本文采用 HaLRTC 算法11求解 Toeplitz 张量填充问题,即当(1.2)中的待填充张量 C 恰好具有 Toeplitz 结构时的情形.由于 HaLRTC 算法在 N 次迭代的每一步均包括了需要较大计算花费的奇异值分解(SVD),本研究主要从以下两个方面改进它以降低其每次迭代中计算奇异值分解的代价:一方面是利用具有特殊结构的 Toeplitz 张量的快速奇异值分解方法,缩减奇异值分解的时间另一方面是应用随机化思想,将在每一步迭代需按全部模展开 Toeplitz 张量的操
12、作改进为按第 n模随机展开一次,减少奇异值分解的次数,从而达到提高算法效率的目的.最后通过数值实验验证改进算法的有效性.2预备知识设 RI1I2表示规模为 I1 I2的实矩阵集.对任意两个实矩阵 X=(xij),Y=(yij)RI1I2,其内积定义为 X,Y =tr(XTY)=i,jxijyij,矩阵的核范数 X和 F范数 XF分别定义为 X=rk=1k(X),其中,k(X)是矩阵 X Rmn的第 k 大奇异值 XF=tr(XX)12=(i,j=1x2ij)12.X RI1I2In表示 n 阶张量,它按第 n 模展开后的矩阵记为 Xn,X 的元素xi1,i2,in相应地映射为矩阵元素Xinj,
13、其中 j=1+Nk=1,k=n(ik 1)Jk,Jk=k1m=1,m=nnm.张量 X 的展开运算定义为 unfoldn(X)=Xn RnnIn,其中 In=Nm=1,m=nnk,其逆运算定义为 foldn(Xn)=X.对任意两个实张量 X=(xi1i2in),Y=(yi1i2in)RI1I2In,其内积定义为 X,Y=i1,i2,inXi1i2inYi1i2in=i1,i2,inxi1i2inyi1i2inX 的F范数定义为 XF=(i1,i2,inx2i1i2in)12=X,X,X 的核范数定义为 X=Ni=1iXi,其中 Xi表示张量 X 按模 i 展开的矩阵核范数 X 的 Tucker
14、 秩定义为rank(X)=(rank(X1),rank(X2),rank(Xn).定义 2.1(奇异值分解(SVD),23)如果秩为 r 的矩阵 A Rmn的全部非零奇异值依次为1 2 r 0,则 A 的奇异值分解定义为:A=UrVT,r=diag(1,2,.,r),其中 U=u1,u2,.,ur Rmr和 V=v1,v2,.,vr Rnr分别为矩阵 A 的前 r 个左、右奇异向量构成的列正交矩阵.定义 2.2(奇异值阈值算子,6)对于任意参数 k 0,奇异值阈值算子 D1k定义为:D1k(A):=UD1k(i,k)VT,D1k(i,k)=diag(i 1k+),其中 A=UrVT Rmn,i
15、 1k+=i 1k,当 i 1k时,0,当 i 1k时.定义 2.3(Toeplitz 矩阵,12)形如T=t0t1tn2tn1t1t0tn3tn2.tn+2tn+3t0t1tn+1tn+2t1t0 Rnn的矩阵称为一个 n n 的 Toeplitz 矩阵.98数学理论与应用显然,T 由其第一行和第一列决定,共有 tn+1,tn+2,.,tn1至多 2n 1 个互异元素,它们分布于 T 的 2n 1 条对角线上.若用 l 表示 Toeplitz 矩阵对角线的指标,则有 l n+1,n+2,.,n 1.相应地,Toeplitz 矩阵填充问题的元素采样指标集 n+1,n+2,.,n 1.用 dia
16、g(T,l)表示 Toeplitz 矩阵 T 的第 l 条对角线元素构成的向量,则diag(P(T),l)=diag(T,l),l ,0,l/.定义 2.4(Toeplitz 均值结构化算子,12)对于任意矩阵 X=(xij)Rnn,Toeplitz 均值结构化算子 T 定义如下:T(X)=n1l=n+1alTl,其中,al=average(diag(P(X,l),l ,Tl=(tij)nn=1,i j=l,0,i j=l,l=n+1,.,n 1.可见,T(X)是由矩阵 X 派生的 Toeplitz 矩阵,即任意矩阵都可以通过结构化算子 T()转化为一个 Toeplitz 矩阵.定义 2.5(
17、Toeplitz 张量,20)给定张量 X RI1I2In.若它满足性质:对一切的 i10,.,I1 1,i2 0,.,I2 1,in 0,.,In 1 及 k 0,.,min(I1 i1,I2i2,.,In in)1,有Ai1+k,i2+k,.,in+k=Ai1i2.in,则称 X 为 Toeplitz 张量.类似于矩阵的情形,将任意张量 X 进行 Toeplitz 结构化的运算表示为(X)=T.3Toeplitz 张量的填充算法本节将文献 11 给出的高精度低秩张量填充算法(算法 3.1)进行修改,应用于求解模型(1.2)中的待填充张量 C 恰好具有 Toeplitz 结构的低秩 Toep
18、litz 张量填充问题(算法 3.2).算法算法 3.1 高精度低秩张量填充算法高精度低秩张量填充算法(Highaccuracy Low Rank Tensor Completion Algorithm,HaLRTC)11初始化初始化:给定下标集合,参数,0,t,X0=P(C),Yi,0=0,k:=0;第第 1 步步:计算for i=1:N doUi,k,i,k,Vi,k=svd(Xi,k+1kYi,k),Mi,k+1=FoldiUi,kD1k(i,k)VTi,k,低秩 Toeplitz 张量的高精度随机填充算法99end for第第 2 步步:计算 Xk+1=1NP(Ni=1(Mi,k+11
19、kYi,k)+P(C);第第 3 步步:若 Xk+1 XkF/XkF,则停止迭代,否则,转 第 4 步第第 4 步步:计算 Yi,k+1=Yi,k k(Mi,k+1 Xk+1),k+1=tk,k:=k+1,转 第 1 步.算法算法3.2高精度低秩张量随机填充算法高精度低秩张量随机填充算法(HighaccuracyLowRankTensorRandomCompletionAlgorithm,HaLRTRC)初始化初始化:给定下标集合,参数,0,t,X0=P(C),Yi,0=0,k:=0;第第 1 步步:随机生成一整数 i=randperm(N,1),并计算Ui,k,i,k,Vi,k=svd(Xi
20、,k+1kYi,k),Mi,k+1=FoldiUi,kD1k(i,k)VTi,k;第第 2 步步:令 Ti,k+1=(Mi,k+1);第第 3 步步:计算 Xi,k+1=P(Ti,k+11kYi,k)+P(C);第第 4 步步:若 Xi,k+1 Xi,kF/Xi,kF,则停止迭代,否则,转 第 4 步第第 5 步步:计算 Yi,k+1=Yi,k k(Ti,k+1 Xi,k+1),k+1=tk,k=k+1,转 第 1 步.算法 3.1 与算法 3.2 的主要区别在于算法 3.2 利用张量结构的同时应用了随机思想.将算法3.1 的每步迭代中张量按每个 n 模展开修改为算法 3.2 中的张量随机地仅
21、按某一 k 模展开一次.虽然算法的迭代步数和计算复杂度有所增加,但是避免了算法 3.1 每步迭代中 N 次展开后带来的奇异值分解计算量,进而体现出算法 3.2 在计算时间上具有优势.结构化张量不仅在数据传输和算法中能够减少存储空间,而且在算法中每次迭代均可保持 Toeplitz 结构.这一方面提高了迭代矩阵的精度,另一方面可以用快速算法进行结构化矩阵的奇异值分解.4收敛性分析引理 4.1由算法 3.2 产生的序列 Yi,k+1 是有界的.证明 令 B=k(Xi,k+1kYi,k Mi,k+1).首先证明 Yi,k和 Xi,k(k=1,2,)是 Toeplitz 张量.由算法 3.2 可知,Yi
22、,0=0 和 Xi,0=0 是Toeplitz 张量.假设 Yi,k和 Xi,k是 Toeplitz 张量,则根据 Xi,k+1=P(Ti,k+11kYi,k)+P(C),Xi,k+1是 Toeplitz 张量.因此 Yi,k+1也是 Toeplitz 张量.由算法 3.2 的第 5 步可得Yi,k+1=Yi,k k(Ti,k+1 Xi,k+1)=Yi,k k(Ti,k+1 Xi,k+Xi,k Xi,k+1)=Yi,k k(Ti,k+1 Xi,k)k(Xi,k Xi,k+1).100数学理论与应用此外,k(Xi,k Xi,k+1)=kP(Xi,k Xi,k+1)=kP(Xi,k(Ti,k+11
23、kYi,k)=kP(Xi,k(Mi,k+1)1kYi,k)=kP(Xi,k(Xi,k+1kYi,k1k(k(Xi,k1kYk Mi,k)+1kYi,k)=P(k(Xi,k1kYk Mi,k)=P(B).再由算法 3.2 的第 2 步可知Xi,k+1kYi,k=Ui,ki,kVTi,k+Ui,ki,kVTi,k,其中Ui,k和Vi,k是大于 1k的奇异值对应的奇异向量,Ui,k和Vi,k是小于等于 1k的奇异值对应的奇异向量,i,k和i,k的对角元素分别大于 1k和小于等于 1k,故 Mi,k+1=Ui,k(i,k 1kI)VTi,k.由 F范数的性质,有BF=k(Xi,k1kYi,k Mi,k
24、+1)F=k(Ui,ki,kVTi,k+Ui,ki,kVTi,kUi,k(i,k 1kI)VTi,k)F=k(1kUi,kVTi,k+Ui,ki,kVTi,k)Fn.再由文献 7 中引理 1 和引理 4 可得 Yi,k+1=Yi,k k(Ti,k+1 Xi,k+1)Ti,k+1.令 Ti,k+1=UVT.再由文献 6 可知Ti,k+1=UVT+W:W Rmn,VTW=0,WV=0,W2 1,UVT+W2F=tr(UVT+W)T(UVT+W)=tr(VVT+WWT)n.因此,Yi,k+1 k(Ti,k+1 Xi,k+1)Fn,P(B)F(B)F BFn,所以序列 Yi,k+1 是有界的.定理 4
25、.1如果 k 且k=11k=+,则序列 Ti,k+1,Xi,k+1 收敛于(1.2)的最优解.证明 由于 1k(Yi,k+1Yi,k)=(Ti,k+1Xi,k+1),由引理 4.1 知(Yi,k+1Yi,k+1)是有界的,所以limk1k(Yi,k+1 Yi,k+1)=limk(Ti,k+1 Xi,k+1)=0.低秩 Toeplitz 张量的高精度随机填充算法101令(T,X)为问题(1.2)的最优解,Y是文献 7 中的对偶问题的最优解.我们首先证明Xi,k+1 X2F+rho2kYi,k+1 Y2F=Xi,k X2F+2kYi,k Y2F(Xi,k+1 Xi,k2F+2kYi,k+1 Yi,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Toeplitz 张量 高精度 随机 填充 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。