一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf
《一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf》由会员分享,可在线阅读,更多相关《一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 49卷 第 4期2023年 4月Computer Engineering 计算机工程一种基于锚框质量分布的动态标签分配策略王璐璐1,2,陈东方1,2,王晓峰1(1.武汉科技大学 计算机科学与技术学院,武汉 430065;2.武汉科技大学 智能信息处理与实时工业系统湖北省重点实验室,武汉 430065)摘要:传统的标签分配策略根据锚框与 ground-truth之间的交并比(IoU)是否超过阈值来划分正负样本,但确定IoU阈值需要依靠大量的经验和实验,并且在不同的网络结构中需要重新设定新的阈值;其次固定的阈值无法保证正负样本数量变化的平缓,过多或过少的正样本都将影响网络训练的稳定性。为解决这
2、些问题,提出一种自适应标签分配策略。根据中心先验原则设计中心权重,通过联合分类得分和定位得分表示锚框质量,组成一个统一的锚框评分方案便于简化划分步骤。为了使网络能够根据训练程度自适应调整 IoU 阈值,保证网络训练的稳定性,利用锚框质量高斯函数模拟锚框总体质量得分的分布情况,使用极大似然估计算法获取最优参数,根据统计结果动态预测最佳 IoU 阈值。实验结果表明,该算法在基于锚框和基于无锚框的检测算法中均使检测性能得到有效提升,在 PASCAL VOC数据集上分别提升 3.1和 6.6个百分点,并且可以有效降低漏检率。关键词:标签分配;目标检测;深度学习;样本;交并比开放科学(资源服务)标志码(
3、OSID):中文引用格式:王璐璐,陈东方,王晓峰.一种基于锚框质量分布的动态标签分配策略 J.计算机工程,2023,49(4):85-91,100.英文引用格式:WANG L L,CHEN D F,WANG X F.A dynamic label assignment strategy based on quality distribution of anchor J.Computer Engineering,2023,49(4):85-91,100.A Dynamic Label Assignment Strategy Based on Quality Distribution of Anc
4、horWANG Lulu1,2,CHEN Dongfang1,2,WANG Xiaofeng1(1.School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China;2.Hubei Province Key Laboratory of Intelligent Information Processing and Real-Time Industrial System,Wuhan University of Science and Technology,W
5、uhan 430065,China)【Abstract】Traditional label assignment strategies divide positive and negative samples according to whether the Intersection over Union(IoU)between the anchor and ground-truth exceeds the threshold.However,determining the IoU threshold requires considerable experience and experimen
6、tation,and new thresholds must be set for different network structures.Moreover,a fixed threshold cannot guarantee the consistent partitioning of positive and negative samples,and too many or too few positive samples will affect the reliability of network training.To solve these problems,we propose
7、an Adaptive Label Assignment Strategy(ALAS).First,the center weights are designed according to the center prior principle;the anchor quality is represented by the joint classification and localization scores;and a unified anchor scoring scheme is developed to simplify the partition.To enable the net
8、work to adaptively adjust the IoU threshold according to the degree of training and ensure the consistency of network training,the anchor quality Gaussian function is used to simulate the distribution of the overall quality score of the anchor.The maximum likelihood estimation algorithm is used to o
9、btain optimal parameters,and then the optimal IoU threshold is dynamically predicted based on statistical results.The experimental results show that the algorithm can effectively improve both anchor-based and non-anchor-based detection algorithms,and it improves these algorithms by 3.1 and 6.6 perce
10、ntage points,respectively,on the PASCAL VOC dataset.Therefore,it can effectively reduce missed detection rates.【Key words】label assignment;object detection;deep learning;sample;Intersection over Union(IoU)DOI:10.19678/j.issn.1000-3428.0064346基金项目:国家自然科学基金(61572381,61273225)。作者简介:王璐璐(1999),女,硕士,主研方向为
11、深度学习、目标检测;陈东方,教授、博士;王晓峰,副教授、博士。收稿日期:2022-03-31 修回日期:2022-05-17 Email:人工智能与模式识别文章编号:1000-3428(2023)04-0085-07 文献标志码:A 中图分类号:TP182023年 4月 15日Computer Engineering 计算机工程0概述 目标检测是计算机视觉领域中一个重要的研究方向,其在人脸识别、无人驾驶、医学图像处理等方面都有广泛的应用。在目标检测过程中,一张图片中会产生成千上万的锚框,而待检测目标可能只有几个,所以需要为锚框匹配相应的目标框,让网络知道每个锚框需要预测的目标是哪个,为锚框匹配
12、ground-truth的过程就是标签分配。标签分配的结果决定了模型的学习目标,进而决定模型的性能1。检测算法主要依据交并比(Intersection over Union,IoU)2的大小划分正负样本,但是如果设置比较低的 IoU 阈值,会得到过多的噪声样本,导致网络的识别能力降低,影响检测精度,而如果 IoU 阈值设置得过高,则只能保留到高质量样本,过滤掉太多中等质量的样本,可能会产生过拟合现象3。设置合理的IoU阈值能够提高检测精度,避免过拟合问题。传统的标签分配是基于交并比的手工分配策略,如需要手动调整 IoU 阈值、提前设定锚框等。近年来关于标签自动化分配的方案越来越多:经典的基于锚
13、框的算法 RetinaNet4根据锚框和 ground-truth之间的交并比确定正负样本;FreeAnchor5在它的基础上,通过极大似然估计的思想构建损失函数去除人工参与指定锚框的过程,使网络能够自主匹配锚框和标签框;基于无锚框结构的 FCOS6网络根据目标中心区域和物体的尺度范围确定正负样本;在FCOS 的基础上,ATSS7通过自适应训练样本选择的方法实现正负样本划分;Autoassign8跳出以往非正既负的分配方式和监督原则,认为每个位置都有正样本属性和负样本属性,在优化过程中,这些样本将会同时受到正样本和负样本的监督,利用正负样本权重平衡配比。虽然当前有很多高效的正负样本划分方法,但
14、FSAF9、FreeAnchor 等都是通过增加额外的卷积层来划分正负样本,然而改变网络结构将会导致其他检测网络无法直接使用这类划分方法。此外,在训练后期,随着定位能力提高,锚框平均 IoU 的数值增大,这会导致网络分配到的正样本数量大幅增加,进而影响训练的稳定性。而采用 K-means10、混合高斯模型11等聚类方法划分正负样本会提高计算复杂度,降低网络训练测试速度。针对以上问题,本文提出一个新的自适应标签分配策略(Adaptive Lable Assignment Strategy,ALAS)。为统一计算锚框分数,设计中心权重函数限定样本点位于 ground-truth 的中心附近,同时联
15、合分类和定位分数,采用统一的加权机制设计锚框质量得分函数。在此基础上,将标签分配建模为一个概率分布的过程,利用高斯模型计算锚框的整体质量分数,通过最大似然估计获取最优参数,使得模型能够根据锚框得分情况动态学习如何分配标签。最后,在MS COCO201712数据集和 5 个主干网络设置下进行对比实验,验证所提方法的有效性。1自适应标签分配策略 自适应标签分配策略设计应考虑以下两点:1)应能够衡量锚框的定位和分类质量;2)将锚框划分为正样本和负样本的过程应是自适应的,这样就不需要人工设计固定的超参数。1.1锚框评分方案首先需要设计一个能够反映网络定位和分类能力的锚框评分方案。图 1 为 FCOS
16、网络训练迭代过程中正样本点的可视化结果(彩色效果见 计算机工程 官网 HTML版本,下同),迭代次数增加后网络定位准确度增加,而这时热力图显示正样本点更多地集中在物体中点附近,可知在训练阶段关注目标框的中心区域可以使检测器达到更好的效果。利用 L213损失函数对离群点的敏感性实现上述 中 心 先 验 的 要 求,记 真 实 边 界 框 的 中 心 点 由(gx,gy)表示,样本点坐标由(bx,by)表示,则本文的中心加权函数如式(1)所示:Wcenter=e-i x,yL2()bi-gi(1)在式(1)中,Wcenter与L2呈负相关,离群点的中心权重相对其他样本点较小。为了使评分方案能够同时
17、评估定位和分类的质量,可以将定位得分和分类得分相乘。直接将网络中分类分支输出的置信度作为分类得分,用中心权重(式(1)表示定位得分,因为定位分支输出的是偏移量而不是一个分数,所以利用中心权重使评分方案更加简洁。本文将锚框评分方案定义为中心权重与分类得分的乘积,如式(2)所示:Q=Wcenter Scls=e-i x,yL2()bi-gi Scls(2)其中:Scls表示分类得分;Wcenter是样本点的中心权重。本文取质量函数 Q的负对数,得到:-ln Q=-ln Wcenter-ln Scls=i x,yL2(bi-gi)+Lcls(3)Q=e-i x,yL2(bi-gi)-Lcls(4)中
18、心权重可以规范样本中心点的位置,但锚框的尺度对框定范围也有影响,不能仅使用中心权重代表定位质量。如图 2(a)和图 2(b)所示,当样本点与 ground-truth 的中心点距离很近时,锚框过大或过小都会使定位不准确,然而在这种情况下它们的中心权重很高。在图 2(a)和图 2(b)中都有较高的中心图 1迭代过程中置信度权重的演化Fig.1Confidence weight evolution during iteration process86第 49卷 第 4期王璐璐,陈东方,王晓峰:一种基于锚框质量分布的动态标签分配策略权重,但是 IoU 较低,进一步利用 IoU 来细致规范锚框的定位就
19、可以将这类锚框从高定位质量锚框的队列中筛选出来,如图 2(c)所示,同时在拥有较高的中心权重和 IoU时才能高质量地预测到物体的位置。具体来说,预测框与对应 ground-truth 框之间的IoU 不仅用于计算 IoU 损失,还可以作为分类的标签。利用 IoU 指导分类训练,即把 one-hot分类标签的 0或 1替换成对应的 IoU,再计算分类损失,可以将IoU 作为定位质量使其与分类相结合,IoU 较低即定位能力很差时,它的分类分数也会比较低。进一步将定位与分类相结合使网络可以同时筛选出定位错误但分类正确的边界框和定位准确但分类错误的边界框。由于将离散的分类标签(0 或 1)替换成了连续
20、的 IoU,因此需要将离散型的 Focal Loss改为连续型的质量焦点损失(Quality Focal Loss,QFL):FFocalLoss=-y ln y-(1-y)ln(1-y)=|-ln y,y=1-ln()1-y,y=0(5)QQFL(p)=Lcls=-|y-py ln p+|y-p()1-y ln()1-p(6)其中:p 为预测结果;的取值为 2;y 为标签即样本点与对应 ground-truth 之间的 IoU 值,y 0,1。具体来说,y=0 表示定位分数为 0 的负样本,0y1 表示IoU 分数为 y 的正样本。在训练过程中,预测框与ground-truth 框之间的 I
21、oU 得分在 0 到 1 之间动态变化。QFL 依旧保留分类的向量,但是对应类别位置的置信度的物理含义不再是分类得分,而是质量预测的分数。如表 1所示,ALAS算法利用 QFL作为分类损失函数比使用 Focal Loss提高了 0.2个百分点。若使用Focal Loss,算法将按照中心先验原则衡量锚框的定位质量。而 QFL联合 IoU,使 ALAS可以在中心先验的基础上进一步考虑到锚框框定范围的准确性。经过优化后,最终的锚框质量评价模块如下:Q=e-i x,yL2(bi-gi)-QQFL(7)1.2正负样本划分策略单纯的锚框质量评价方案只是一个锚框得分的计算方式,依旧无法动态调整 IoU 阈值
22、。为了动态掌握网络的训练状态,更方便模型根据总体质量得分分布情况划分正负样本,本文使用高斯模型模拟锚框评分的分布情况,引入一个参数可学习的锚框质量高斯函数 G(如式(8)所示),根据不同的数据分布自动调整 IoU阈值。通过 MLE最大化锚框的质量得分 Q的概率计算最优参数。G(Q|x,g,)=12 exp(-()Q-222)(8)其中:Q 表示式(7)中的质量得分;和是可学习的参数。一开始,参数会被初始化为 0,=1。给定一组锚框得分,可以使用最大似然估计算法优化函数G 的概率,计算最优参数。本文将参数和的总和作为 IoU阈值。若基于聚类思想采用混合高斯模型模拟锚框得分情况,则无法使用最大似然
23、估计为其求解,而需要通过迭代的方法划分代表正负样本的两个高斯模型,迭代求解的过程将大大影响网络训练和检测的速度。本文方法可直接利用 MLE 求解,在参数量、计算复杂度和检测速度上都的到了进一步优化。算法 1 描述了所提方法对输入图像的工作原理。对于图像上的每一个 ground-truth 标签框 g,首先找出它的候选正样本。如算法 1第 37行描述,在金字塔的每一层选取 k个质量评分最高的锚框。之后根据这些候选框的质量得分计算出锚框质量高斯函数 G,见算法第 9行。在算法第 10行,通过极大值似然估计计算出 和 两个参数,根据这些统计数据计算 ground-truth g的 IoU 阈值tg=
24、g+g。最后只需要根据算法第 1216 行选择那些 IoU 大于或等于IoU阈值的候选框作为正样本,如果一个锚框被分配给多个 ground-truth,则会选择 IoU 最高的那个,其余都是负样本。算法 1 自适应标签分配策略 ALAS输入 ground-truth标签框G,所有的锚框A,金字塔第i层的锚框Ai,金字塔层数 L,每层金字塔选取的候选框数 K输出 正样本 P,负样本 N1.P ,N ,Cg 2.for g G3.for i=1 to L do4.Wcenter计算中心权重5.Qi计算锚框质量(Ai,g)6.Si根据Qi选择 K个候选框7.Cg=Cg Si8.end for9.G(
25、Q|x,g,)计算 G10.通过最大似然估计计算参数g、g11.为 ground-truth g计算 IoU阈值:tg=g+g12.for each candidate c cg do图 2中心权重定位的局限性Fig.2Limitations of center weight positioning表 1Focal Loss和 QFL对网络结果的影响 Table 1Effect of Focal Loss and QFL on network results%计算方式Focal LossQFLAP78.678.8872023年 4月 15日Computer Engineering 计算机工程1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 质量 分布 动态 标签 分配 策略 王璐璐
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。