分销赏收藏举报申诉 / 10

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于自编码器的过完备多级表示深度子空间聚类.pdf

基于自编码器的过完备多级表示深度子空间聚类.pdf

上传人：自信****多点

文档编号：2638712

上传时间：2024-06-03

格式：PDF

页数：10

大小：3.62MB

《基于自编码器的过完备多级表示深度子空间聚类.pdf》由会员分享，可在线阅读，更多相关《基于自编码器的过完备多级表示深度子空间聚类.pdf（10页珍藏版）》请在咨信网上搜索。

1、第 47 卷第 2 期浙江师范大学学报(自然科学版)Vol.47,No.22024 年 5 月 Journal of Zhejiang Normal University(Nat.Sci.)May 2024 DOI:10.16218/j.issn.1001-5051.2024.014基于自编码器的过完备多级表示深度子空间聚类汪雷杰,徐慧英,朱信忠,汪紫莹(浙江师范大学计算机科学与技术学院,浙江金华 321004)摘要:深度子空间聚类网络利用深度自表达性,借助具备全连接层的欠完备深度自编码器,有效地解决了无监督子空间聚类难题.然而,该方法使用输入数据的不完全表示,并且缺乏低级和高级信息的集

2、成,从而损害其鲁棒性.为解决这一问题,提出了一种新的深度子空间聚类方法,该方法使用卷积自动编码器将输入图像转换为位于线性子空间联合上的新表示.在编码器层加入了过完备分支,使得网络能够捕捉到更精细的数据细节.此外,在编码器和相应的解码器层之间引入多个完全连接的线性层.这些互相连接的层协同作用,将低级和高级信息结合在一起,从而在编码器的不同层级上生成了多组自表达和信息表示.该过程有效地促进了特征学习过程.最后,引入了一个新的损失最小化问题,利用初始样本聚类有效地集成了多级表示,从而更准确地恢复了底层子空间结构.随后,采用迭代方案来最小化损失函数.在 4 个真实数据集上的实验结果表明,在大多数子空间

3、聚类场景中,本文方法最优.关键词:无监督学习;深度子空间聚类;自动编码器;过完备表示;多层次表示中图分类号:TP181 文献标识码:A 文章编号:1001-5051(2024)02-0166-10Overcomplete multi-level representation subspace clustering based on autoencoderWANG Leijie,XU Huiying,ZHU Xinzhong,WANG Ziying(School of Computer Science and Technology,Zhejiang Normal University,Jinhu

4、a 321004,China)Abstract:The deep subspace clustering network leveraged deep self-expressive capabilities by utilizing an undercomplete deep autoencoder with fully connected layers to effectively address the challenge of unsuper-vised subspace clustering.However,this method employed an incomplete rep

5、resentation of input data and lacked the integration of low-level and high-level information,thereby compromising its robustness.To address this issue,a novel deep subspace clustering method was proposed.The propsed method utilized a convolution-al autoencoder to transform input images into a new re

6、presentation situated in a linear subspace union.By incorporating an overcomplete branch within the encoder layer,it enabled the network to capture finer details of the data.Additionally,it was introduced multiple fully connected linear layers between the encoder and corresponding decoder layers.The

7、se interconnecting layers synergistically combine low-level and high-level information,generated multiple sets of self-expressive and informative representations across various levels of 收文日期:2023-08-15;修订日期:2023-09-26基金项目:国家自然科学基金资助项目(62376252;61976196);浙江省自然科学基金重点资助项目(LZ22F030003)作者简介:汪雷杰(1997),男,

8、浙江宁波人,硕士研究生.研究方向:子空间聚类;深度聚类.通信作者:徐慧英.E-mail:xhy the encoder.The process effectively facilitated the feature learning procedure.Furthermore,a novel loss mini-mization problem was introduced to effectively integrate multi-level representations by leveraging initial sample clustering,resulting in a mor

9、e accurate recovery of the underlying subspace structure.Subsequently,by em-ploying an iterative scheme to minimize the loss function,the experimental results on four real datasets demon-strated that the proposed approach outperformed state-of-the-art methods in the majority of subspace clustering s

10、cenarios.Key words:unsupervised learning;deep subspace clustering;automatic encoder;overcomplete representa-tion;multi-level representation0 引言子空间聚类是一种学习范式,它以无监督的方式致力于将位于多个低维子空间联合的一组数据样本划分成不同的聚类,使每个聚类内的样本属于同一子空间.随着各种数据量的快速增长,子空间聚类在模式识别和分析中发挥着越来越重要的作用,如运动分割1、人脸聚类2、电影推荐3.大量的子空间聚类依赖自表达性的概念,即子空间中的每个样本点

11、都可以用基于同个子空间中其他点的线性加权集合来表示.鉴于此,通过线性表示来揭示样本之间的潜在关系,并将它们划分到彼此对应的子空间中.在这个过程中,需要每个样本线性表示中的非零系数对应于给定样本在相同子空间中的点.为了实现这一目标,通常采用以下方法:首先从输入数据中学习亲和矩阵,然后利用谱聚类技术4进行聚类恢复.尽管自表达性在文献中发挥着关键作用,但在应用于样本位于高度非线性子空间的情况下,其效果可能并尽如人愿.实际数据样本通常包含高度非线性的结构,这使得自表达性在实践中并不总能满足线性子空间解决方案.在人脸数据集中,由于图像的光照不均和被测对象的不同姿态,导致相同目标的人脸图像通常处于非线性子

12、空间中.为了处理这些情况,常见的实践技术是利用核技巧将样本映射到更高维度的空间,以使它们更符合线性子空间的要求5-8.尽管这种策略在某些情况下取得了成功,但并不适用于所有应用,主要是因为给定的数据点集识别合适的核函数是一项相当具有挑战性的任务9.为解决非线性情况,深度子空间聚类网络(deep subspace clustering,DSC)10采用多个非线性层的深度自编码器对高度非线性的输入数据进行建模.同时,在自编码器的中间引入一个无偏差的全连接层,即自表达层,用于学习数据样本之间的亲和关系.然而,DSC 只依赖于编码器组件最后一层的输出来捕获子空间结构,并进行子空间聚类,这可能无法完整地建

13、模全面的子空间结构.该方法仍存在 2 个主要问题:首先,当 DSC 存在数据噪声时,系统的抗扰性较差,性能受到很大影响;其次,DSC 在很大程度上依赖预训练停止的位置,如果在预训练过程中在清晰重构的正确阶段之前或之后的某些阶段停止,聚类结果将变得不稳定,性能也会明显下降.本文提出了一种新的基于频谱聚类的方法,该方案在能够获得鲁棒表示和稳定训练的同时提高了性能.笔者提出过完备多级表示深度子空间聚类(overcomplete multi-level representation subspace cluste-ring,OMDSC),使用堆叠卷积自编码器与过完备表示,使其具有更强的鲁棒性,并且在噪

14、声存在的情况下也能灵活地匹配数据结构.本研究采用了一种新颖的方法来解决表示学习的问题.引入一个 DSC 中的自编码器,并与过完备卷积自编码器并行训练,以实现更优的数据表示.为了推断多级表示,在编码器和解码器的相应层之间添加了多个完全连接的线性层.接着,将过完备表示和不完全表示相结合,通过自表达层学习数据点之间的成对亲和力.这个简单而有效的融合技巧使得训练过程更加稳定,且不过度依赖预训练过程.通过广泛的实验分析,对这种方法进行了全面的评估.预训练的 OMDSC 自编码器在重构任务上表现出色,比预训练的 DSC 自编码器更为优越,说明过完备网络学习到了更有效的表示.在761 第 2 期汪雷杰,等

15、:基于自编码器的过完备多级表示深度子空间聚类4 个基准数据集上进行了评估,涵盖了 MNIST,COIL20,ORL 和 Extended Yale B.实验结果显示,本文提出的 OMDSC 方法在与 DSC 及其他传统子空间聚类方法的比较中表现出明显的优势.总的来说,本研究展示了一种创新的表示学习方法,通过引入并行训练的自编码器,融合过完备和不完全表示,取得了显著的性能提升.这一方法有望在实际应用中发挥重要作用,并为进一步的研究提供了新的思路.表 1 符号表符号描述X样本矩阵xi矩阵 X 的第 i 行xij矩阵 X 的第 i 行第 j 列元素X主网络重构矩阵X过完备网络重构矩阵Ze潜在表示矩阵

16、D层唯一信息矩阵C自表达矩阵Q单热矩阵QT单热矩阵的转置F矩阵 X 的 F 范数1矩阵 X 的 l1范数2矩阵 X 的 l2范数RNNNN 阶矩阵I单位矩阵超参数e编码器参数d解码器参数1 准备工作1.1 符号说明本文符号见表 1.1.2 自表达性子空间聚类本节将回顾与本文提出的框架最相关的方法.传统的子空间聚类方法的核心目标是学习一个加权图,其中边的权重表示输入数据样本之间的关联程度.随后,可以借助谱聚类11或其变体12,将这个图划分成一组不相交的子图,每个子图对应于一个不同的聚类1,13-14.在实现这一目标时,常用的加权图计算公式为minCRNN12X-XC22+g(C),s.t.dia

17、g(C)=0.(1)式(1)中:XRdN是一个矩阵,每一列都代表着一个样本xiRdni=1;C 为自表达矩阵,其中元素 xij表示样本 xj对重构 xi的贡献;gRNNRNN是正则化约束;0 是一个超参数,用于平衡不同项之间的重要性.在本文方法中,的作用是调整过完备项和不完全项在表示学习中的相对权重.利用 diag(C)=0 避免了平凡解 S=I,即样本是自身的线性组合.一旦得到了式(1)的最优解,由(C+CT)/2 计算亲和矩阵,并将其输入 SPA 算法,得到聚类结果.随着深度模型在计算机视觉和机器学习应用中越来越普遍,子空间聚类技术通常使用自编码器从输入数据中提取深层自衍生的表示.其中,D

18、SC 在深度自编码器中引入了一个新增的自表达层,即在编码器与解码器之间插入完全连接的线性层,以便有效生成适用于子空间聚类的表示.DSC 提出以下模型:L(,C)=12X-X2F+1Cp+22Ze-ZeC2F,s.t.diag(C)=0.(2)式(2)中:10 和 20 是固定的超参数,用于控制不同项的重要性;p=1 或 2;=e,C表示网络参数;矩阵 ZeRdn,其中 d 是表征的维度.式(2)的主要目标是计算网络参数,使得 Ze=ZeC 成立,重构矩阵 X能够近似输入矩阵 X.使用反向传播和谱聚类算法找到式(2)的解,并且确定样本的分类.1.3 过完备表示方法过完备表示最初作为一种替代信号表

19、示方法和更通用的方法被引入15.该方法涉及使用过完备基或过完备字典,使得基函数的数量大于输入信号样本的数量.这种设计赋予了过完备表示更高的灵活性,能够更有效地捕获数据中的结构,从而证明其更为健壮.当前深度学习中广泛采用的所有主要架构均采用通用的“编码器-解码器”架构.在这一结构中,编861浙江师范大学学报(自然科学版)第 47 卷码器的作用是从输入数据中提取抽象特征,而解码器则通过学习将潜在的低维表示转换为高维输出,以完成具体任务.然而,这种通用的“编码器-解码器”模型属于不完全表示的范畴,因为与输入数据相比,潜在空间中的空间维度数量较少.为了克服这一限制,提出了深度卷积过完备自动编码器16.

20、该模型在卷积层之后添加了编码器的最大池化层和解码器的上采样层.最大池化降低了特征映射的空间维度,而上采样则相反.通过这种设计,深度网络的初始层被迫学习低级特征,而深层则学习高级特征.随着涵盖范围的扩展,深层的滤波器能够接触到初始图像中更广泛的像素信息,进而有助于学习更高级的特征.通过在编码器的每个卷积层后添加上采样层,使网络能够将输入数据映射到更高的空间维度.这种过完备表示增加了网络的灵活性和健壮性,能够更好地捕获数据中的结构和特征.本文特别关注了感受野大小的变化,这是通过将编码器中的最大池化层替换为上采样层实现的.将编码器中的最大池化层替换为上采样层,会导致更深层的接受场大小受到限制,从而使

21、更深层比初始层学习到更精细的细节,如图 1 所示.(a)不完整的网络结构 (b)过度完整的网络结构图 1 在不完整的网络架构和过度完整的网络架构中接受场的变化过程为了进一步理解这一点,设 X 为输入图像,F1和 F2分别为从第 1 层和第 2 层提取的特征映射.在这些欠完备架构的转换层中存在的最大池化层(如图 1(a)所示)是连续层中接收野较大的主要原因.设卷积滤波器在图像上的初始接受域为 kk.由于最大池化层引起的感受野变化取决于池化系数和池化滤波器步长这 2 个变量,所以在相关系数的配置上,池化系数和步长都设置为 2(与大多数网络一样).考虑到这种配置,输入图像上的第 2 层(将 F1转发

22、到第 2 层)的感受野为 2k2k,同样,第 3 层(将F2转发到第 3 层)的感受野为 4k4k,这种感受野的增加可以推广到不完全网络的第 i 层,其感受野的大小为 22(i-1)kk.对于提出的过完备网络,用系数为 2 的上采样层代替最大池化层.由于上采样层实际上与最大池化层的工作原理完全相反,因此,现在输入图像上的卷积第 2 层的接受场将是12k12k.类似地,第 3 层的接受野现在是14k14k.对于过完备分支的第 i 层,这种感受野可以增加12()2(i-1)kk.通过可视化特征映射发现过完备网络能更详细和完整地捕获边缘.相比之下,欠完备网络的深层特征较为粗糙,可能是因为其特征尺寸较

23、大.这凸显了过完备表示的优越性.引入过完备表示提高了深度神经网络对数据细节的敏感性,从而提升了图像处理任务的性能.过完备网络学习的高质量特征有助于提高任务的准确性和健壮性.这些发现对深度学习领域具有重要意义.2 OMDSC 方法OMDSC 方法(见图 2)从过完备表示中得到启发,本文方法可以看作是 DSC 算法的推广10,即利用输入数据的低级和高级信息产生更多信息和判别性更强的子空间聚类表示.此外,引入了一些连接层,同时学习多层次的深度表示并有效地融合它们,以提高聚类性能,该问题采用样本的初始聚类来有效地聚合从多层次表示中获得的知识,促进学习更准确的子空间.2.1 多级表示学习方法961 第

24、2 期汪雷杰,等:基于自编码器的过完备多级表示深度子空间聚类图 2 OMDSC 方法结构图与传统的解码器组件不同,传统的解码器组件专门用于视图数据的重构 X,只能从潜在编码中找到Ze.受残差网络的影响,多级表示学习提出了一种引入多个完全连接层的方法,用于编码器和解码器之间的信息流.每对网络层之间没有偏差,因此,自编码器提供了多条信息路径.这些连接层可以被视为自表达矩阵的权重矩阵.这种方法具有以下优势:首先,连接层从输入数据中提取不同复杂层次的信息,并将其整合在一起,从而提高聚类性能;其次,它监督每层编码器组件的输出,产生多组满足自表达特性的表示.编码器组件中学习到的表示继续被输入到完全连接的

25、层,然后传递到解码器组件的相应层.这种策略使得解码器组件能够更准确地重构输入数据,减少了信息丢失.该方案通过重用不同级别的信息,使解码器组件更准确地重构输入数据,减少了下采样过程中造成的信息丢失.2.2 OMDSC假设编码器的每个全连接层都与 2 个矩阵相关联,它们以自我表达矩阵之和的形式出现.其中,第1 个矩阵在整个编码器层中共享,第 2 个矩阵是每个特定层的独有部分.编码器可被理解为将输入空间映射到表示空间的映射函数,其目标是保持不同表示层次上数据样本之间的关系.此外,在编码器的不同层次上,一些样本之间可能具有更强或更弱的关系.为了捕获编码器层之间共享的关系信息,引入了自表达矩阵 CRnn

26、和产生各个层独特信息的层独特矩阵 DRnn作为独特的矩阵来产生各个层的独特信息.通过优化以下损失函数,联合使用反向传播:LAE+1Lself=X-X2F+1Vv=1Zve-Zve(C+Dv)2F,s.t.diag(C+Dv)=0,v 0,1,V.(3)式(3)中:LAE表示重建损失;Lself表示自我表达损失,通过超参数 1(0)控制自我表达损失的贡献.通过优化式(3),能够捕获所有层的共享子空间结构,同时考虑每层获取的独特子空间表示,有助于全面探索多视图数据中的子空间表示.该方法是一种集成学习的子空间聚类技术,融合了原始数据空间的子空间结构和不同层次潜在空间的信息,显著提高整体聚类性能.这种

27、方法能有效地提取数据中的关键特征,并为聚类提供更准确的表示.为了更好地服务于子空间聚类,利用矩阵范数约束自表达矩阵,保持期望结构.为确保自表达矩阵C 的连通性,采用 l1范数稀疏化.这种范数稀疏化引入了一种惩罚机制,鼓励自表达矩阵 C 优先选择一071浙江师范大学学报(自然科学版)第 47 卷部分元素,同时将其他元素的权重设置为零,它有助于降低模型的复杂性,范数稀疏化迫使矩阵 C 变得更加简单,减少了参数的数量和整体复杂度.此外,这种正则化技术降低了过拟合的风险,因为它阻止了模型依赖所有可用的特征,而是鼓励模型集中在最具信息量的特征上.l1范数稀疏化公式为X1=ni=1xi.(4)对特定层矩阵

28、 D,使用弗罗贝尼乌斯范数来保证其与每个全连通层相关联的亲和图的连通性.弗罗贝尼乌斯范数,也称为矩阵的 F 范数,通常用于度量矩阵的大小或矩阵之间的相似性.通过比较它们的邻接矩阵或其他相关矩阵,可以判断它们之间的结构是否相似.F 范数为XF=(ni=1mj=1xij2)12.(5)引入相应的正则化项,增加连通性和稀疏性约束.为了使这些自表达矩阵符合期望的结构,引入以下正则化项目:Lreg=2Lreg_C+3Lreg_D=2QTC 1+3Vv=1Dv2F.(6)式(6)中,20,30 是超参数.正则化项 Lreg_C用于将从输入数据的初始伪标签获得的信息合并到模型中.设 QRnk,是一个单热矩阵

29、,其作用为分配给样本的初始伪标签.将 QT与 C 相乘得到一个矩阵.正则化项 Lreg_D促进不同矩阵的元素在值上相似,这反过来又可以增强与每个全连接层相关联的亲和图的连通性.考虑到损失函数式(3)和式(6),提出总的损失函数为L=LAE+1Lself+Lreg=X-X2F+1Vv=1Zve-Zve(C+Dv)2F+2QTC 1+3Vv=1Dv2F,s.t.diag(C+D)=0.(7)式(7)中,i 0(i=1,2,3),是用来平衡不同损失贡献的超参数.采用标准反向传播技术得到式(7)的解.一旦得到解矩阵 C 和DvVv=1,就可以创建如下形式的对称亲和矩阵 A:A=C+CT2+Vv=1Dv

30、+(Dv)T2().(8)在此模型中,可以利用谱聚类生成的伪标签来重新训练模型,并提供更精确的子空间估计.为此,引入了一个全新的方法,该方法假设单热矩阵 Q 是一个变量,并开发了一种迭代方案来共同学习网络参数和矩阵 Q.该方法预先给定 Q 的值,交替运行模型以训练网络参数,然后更新单热矩阵.重复这个训练过程,直到迭代次数达到最大迭代次数.算法 1 详细描述了该方案的不同步骤.算法 1 提出子空间聚类方法输入:X,Q,T,k=11:重复2:更新自编码器和自表达层的参数 e,d和vselfVv=0,通过最小化式(7)得到自表达矩阵 C 和DvVv=13:如果 k mod T=0,则执行以下步骤:4

31、:构建亲和矩阵 A5:应用谱聚类算法更新 Q6:结束本次迭代7:k=k+18:直到 k最大迭代次数171 第 2 期汪雷杰,等:基于自编码器的过完备多级表示深度子空间聚类Output:Q3 实验实验配置:操作系统 Ubuntu,GPU GeForce RTX 4090.项目环境为 pyharm2021.3,使用超参数设置批量大小,其大小为所有样本数.本节根据聚类误差评估聚类结果,即错误聚类样本占整个样本点的百分比,评估了 OMDSC 在 4 个公开数据集上的性能,包含一个目标图像数据集(COIL20)、一个手写数据集(MNIST)以及 2 个人脸图像数据集(ORL 和 Extended Y

32、ale B).4 个数据集的具体参数见表2,图3 展现了4 个数据集的部分数据.表 2 数据集统计数据集数量/个类别/个图像尺寸Extended Yale B2 43238(192,168,1)ORL40040(112,92,1)COIL201 44020(128,128,1)MNIST70 00010(28,28,1)(a)Extended Yale B (b)ORL (c)COIL20 (d)MNIST 图 3 数据集本文方法与以下基线进行比较:低秩表示(LRR)1、低秩子空间聚类(LRSC)17、稀疏子空间聚类(SSC)18、高效密集子空间聚类(EDSC)19、带有预训练卷积自编码

33、器特征的 SSC(AE+SSC)、深度子空间聚类(DSC)网络10、具有块对角正则化器的自监督卷积子空间聚类网络(S2CSCN)20、过完备深度低秩子空间聚类(ODLRSC)2、过完备深度子空间聚类(ODSC)16和具有自我表达和自我监督的深度子空间图像聚类网络(DSCNSS)21.接下来将详细讨论每个数据集使用的超参数,以及对现有方法的改进.每个数据集的超参数不同,因为每个数据集中的数据数量不同.请注意,为了公平地比较,在所有的实验中,与 DSC 相比,通过降低一层中使用的滤波器的数量来匹配或使用更少的自表达层参数,本文使用 2 个编码器.如表 3 所示,OMDSC 的表现优于所有其他方法.

34、表 3 不同方法在 Extended Yale B,ORL,COIL20 和 MNIST 数据集上的聚类误差单位:%模型Extended Yale BORLCOIL20MNISTLRR34.8138.2531.0146.14LRSC29.8932.5031.2548.60SSC27.5132.5014.8654.70EDSC11.6427.2514.8643.50AE+SSC25.3326.7522.0851.60DSC2.6714.005.1425.00S2CSCN2.6312.753.0619.70ODLRSC2.5513.003.3319.80ODSC2.2212.002.5018.8

35、0DSCNSS1.8510.503.6719.20OMDSC1.0310.501.9418.20271浙江师范大学学报(自然科学版)第 47 卷在实验中,采用了特定的网络配置和参数设置.卷积层使用步长为 2 的核滤波器和 ReLU 激活函数,对于全连接层,使用线性权值,不考虑偏置或非线性激活函数.模型训练使用 Adam22优化器,其中1=0.900,2=0.999,学习率为0.001.单热矩阵 Q 初始化为零矩阵,一些矩阵 C 和DvVv=1的元素设置为 0.000 1,直到 Q 收敛到稳定态.3.1 Extended Yale B 数据集Extended Yale B 数据集被用作子空间聚

36、类的流行基准.收集了在不同光照条件下拍摄的人脸图像集合.它由 38 个类组成,每个类有 64 张图像,总共有 2 432 张 192168 大小的图像.为了满足计算的目的,并且根据文献10,18,将这些图像从原始尺寸降维至 4842,以便与基线进行比较.用于该数据集的网络架构采用一个过完备分支以及一个自编码模型.在过完备分支中有 2 个堆叠的卷积块,该分支具有15 和30 个大小分别为55 和33 的滤波器.在多级表示模型中采用3 个堆叠的卷积编码器,该模型分别具有 10,20 和 30 个大小分别为 55,33 和 33 的滤波器,在解码器中反之.在数据集中除了过完备分支的第 1 层步长为

37、1 外,其他所有卷积层中步长为 2.在该数据集上使用的超参数为:1=100,2=40,3=10,T=100.网络经过 1 800 次迭代.实验结果如表 3 所示.可以看出,OMD-SC 优于所有其他方法.3.2 ORL 数据集ORL 数据集包含 400 张人脸图像,图像尺寸为 11292,来自 40 个参与者(类别),每个参与者拍摄了 10 张照片,涵盖多种姿势、光照条件和面部表情.为了降低数据的复杂性,笔者将图像尺寸降维至 3232.该数据集对子空间聚类具有挑战性,主要由于面部表情的外观变化和每个受试者图像数量的限制.在 ORL 数据集上开展了一系列实验,用于该数据集的网络架构 OMDSC

38、在编码器的过完备分支中有 2 个卷积块,分别有 3 和 6 个滤波器,卷积核为 33.在多级表示中,采用了由 3 个卷积编码器层组成的网络架构,分别有 3,3 和 6 个滤波器,卷积核为 33.实验中使用的参数设置为:1=2,2=1,3=0.5,T=10,最大轮次设置为 420.实验结果如表 3 所示.可以看出,除了 DSCNSS 在 ORL 上获得最小的聚类错误率外,OMDSC 优于所有竞争对手的方法.3.3 COIL20 数据集COIL20 数据集包含了来自 20 个不同对象(类别)的 1 440 张图像,每个对象各有 72 张黑色背景图像,以 5的姿态间隔拍摄.大的视点变化给子空间聚类带

39、来挑战.过去的文献10,23-24大多采用单层卷积自编码器来学习特征表示,但这种设置不适合本文方法.本文提出了一种网络架构,其中在编码器的过完全分支中有 1 个卷积块,卷积层的核大小为 33,滤波器数量为 10.多级表示采用 2 层卷积自编码器模型,分别有 5 和 10 个滤波器,卷积层的核大小为 33.COIL20 数据集的参数设置如下:1=20,2=20,3=5,T=5,最大轮次为 50.COIL20 的聚类误差结果如表 3 所示.在 COIL20 数据集上,本文的 OMDSC 方法比 DSC 方法提高了 3.20%.3.4 MNIST 数据集MNIST 数据集有一个从 0 到 9 的手写

40、数字图像集合.从每个类中随机抽取 100 张图像,共 1 000 张图像,并使用这 1 000 张图像的集合进行子空间聚类任务.图片大小为 2828.值得注意的是,MNIST 数据集考虑了许多由手写风格引起的变形,即使是在单个类中,这使得聚类任务变得困难,因为它是一个无监督的设置.在过完备分支中有 2 个卷积块,该分支具有 10 个和 5 个大小分别为 55 和 33 的滤波器.在多级表示模型中采用 3 个堆叠的卷积编码器,该模型分别具有 20,10 和 5 个大小分别为 55,33 和 33 的滤波器,在解码器中反之.在该数据集上使用的超参数为:1=1,2=1,3=5,T=5.网络经过 10

41、0 次迭代.聚类误差方面的结果列在表 3 中,可以看到,与 DSC 相比,本文的 OMDSC 方法实现了 6.80%的改进.3.5 消融实验对于消融研究,从 DSC 开始,它使用了一个不完整的深度自动编码器,网络结构见表 4.接着使用过371 第 2 期汪雷杰,等:基于自编码器的过完备多级表示深度子空间聚类完备网络与 DSC 结合,表示为 ODSC,网络结构见表 5.然后,使用 DSC 为基底,搭载多级表示,表示为ML.与其他 4 种方法相比,OMDSC 方法具有不完全和过完全编码器以及多级表示的融合编码器架构.在 Extended Yale B 数据集上进行了多次对比实验,分别从 Exte

42、nded Yale B 数据集中抽取 10 个类别,20个类别,30 个类别,并最终使用包含全部 38 个类别的 Extended Yale B 数据集进行实验.从表 6 可以看出,OMDSC 在数据集上的性能都优于其他方法.该实验清楚地表明了所提出的子空间聚类方法的意义.表 4 DSC 结构表网络层Encoder-1Encoder-2Encoder-3Decoder-1Decoder-2Decoder-3卷积核尺寸553333333355通道数/个102030302010表 5 ODSC 结构表网络层Encode-1Encoder-2Encoder-3Decoder-1Decoder-2De

43、coder-3Oencoder-1Oencoder-2卷积核尺寸5533333333555533通道数/个1020303020101530表 6 消融实验表单位:%Extended Yale BDSC-L2DSC-L1ODSCMLOMDSC10 个类别1.252.031.250.940.7820 个类别1.802.111.561.020.9430 个类别2.192.812.241.411.2538 个类别2.673.332.221.361.033.6 参数敏感性实验使用不同的超参数(1,2,3)在 Extended Yale B 数据集上进行了多次实验,以评估所提出的方法对这些参数选择的敏感

44、性.实验结果见表 7.观察到,所提出的方法在这些超参数的大范围内表现出令人满意的性能,证明了它的泛化能力.表 7 敏感性实验表单位:%Extended Yale B(1,2,3)(1,1,1)(1,0.1,1)(1,100,1)(1,1,0.1)(1,1,100)(0.1,1,1)(10,1,1)10 个类别0.940.940.780.780.941.561.0915 个类别0.940.940.940.830.940.940.8320 个类别0.940.941.020.940.941.100.8625 个类别1.191.061.121.001.120.941.0930 个类别1.311.25

45、1.311.251.251.251.2535 个类别1.381.341.341.341.341.291.3438 个类别1.271.231.231.231.191.231.234 结语本文提出了一种新的基于自编码器的方法,该方法利用深度神经网络架构来解决子空间聚类问题.该方法改进了现有的深度方法,利用来自不同层次网络的信息以及过完备数据信息,将输入样本转换为位于线性子空间联合上的多级表示.此外,利用谱聚类技术生成的伪标签有效地监督表征学习过程,提471浙江师范大学学报(自然科学版)第 47 卷高最终的聚类性能.在基准数据集上的实验表明,该方法能够有效地处理非线性子空间的聚类,并且与现有方法相

46、比取得了更好的结果.在未来的工作中,所提出的聚类方法将应用于实际的计算机视觉中,同时也会思考如何减少 OMD-SC 的参数数量,以降低训练的成本.参考文献:1LIU G,LIN Z,YAN S.Robust recovery of subspace structures by low-rank representationJ.IEEE T Pattern AnaI,2013,35(1):171-184.2FENG Y,YOU C.Overcomplete deep low-rank subspace clusteringC/GUERRERO J E.2022 21st Internationa

47、l Symposium on Distributed Computing and Applications for Business Engineering and Science(DCABES).Chizhou:IEEE Computer Society,2022:205-208.3ZHANG A,FAWAZ N,IOANNIDIS S.Guess who rated this movie:identifying users through subspace clusteringC/FREITAS N D.UAI12:Proceedings of the Twenty-Eighth Conf

48、erence on Uncertainty in Artificial Intelligence.Catalina Island:Association for Uncertainty in Artificial Intelligence,2012:944-953.4GOODFELLOW I.Generative adversarial netsC/GHAHRAMANI Z.Advances in Neural Information Processing Systems 27.Monterey:Neu-ral Information Processing Systems Foundation

49、,2014:2672-2680.5YIN M,GUO Y,GAO J.Kernel sparse subspace clustering on symmetric positive definite manifoldsC/29th IEEE Conference on Computer Vision and Pattern Recognition.Las Vegas:IEEE,2016.6XIAO S,TAN M,XU D.Robust kernel lowrank representationJ.IEEE T Neur Net Lear,2015,27(11):2268-2281.7PATE

50、L V M,VIDAL R.Kernel sparse subspace clusteringC/2014 IEEE International Conference on Image Processing.Paris:International Association for Pattern Recognition,2014.8PATEL V M,NGUYEN H V,VIDAL R.Latent space sparse subspace clusteringC/IEEE International Conference on Computer Vision.Syd-ney:Interna

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于编码器完备多级表示深度空间

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。