基于亮度残差的VVC帧内编码改进算法.pdf
《基于亮度残差的VVC帧内编码改进算法.pdf》由会员分享,可在线阅读,更多相关《基于亮度残差的VVC帧内编码改进算法.pdf(7页珍藏版)》请在咨信网上搜索。
1、第 37 卷第 3 期2023 年 6 月南华大学学报(自然科学版)Journal of University of South China(Science and Technology)Vol.37 No.3Jun.2023收稿日期:2023-01-20基金项目:国家自然科学基金项目(62001209)作者简介:王芳冰(1997),女,硕士研究生,主要从事深度学习和强化学习等方面的研究。E-mail:。通信作者:林文斌(1970)男,教授,博士,主要从事深度学习与强化学习等方面的研究。E-mail:lwb usc.eduDOI:10.19431/ki.1673-0062.2023.03.00
2、7基于亮度残差的 VVC 帧内编码改进算法王芳冰1,李 跃2,林文斌1,2(1.南华大学 数理学院,湖南 衡阳 421001;2.南华大学 计算机学院,湖南 衡阳 421001)摘 要:通用视频编码(versatile video coding,VVC)标准由联合视频专家组共同制定,它遵循基于混合块的编解码器及其前身高效视频编码(high efficient video coding,HEVC)的传统架构。与 HEVC 相比,VVC 的帧内预测功能包含大量修改,编码效率大大提高。在 VVC 的基础上,提出了一种改进的基于亮度残差的帧内编码算法,通过减少率失真代价的检查次数,在保证编码质量不受较
3、大影响的前提下,降低了计算复杂性,并提高了 VVC 的帧内编码效率。实验结果表明,在 VTM16.0 的 VVC 软件版本下,在相同配置下,改进算法的编码时间可以减少 27.03%,而 Bjntegaard-Deltarate 只增加了 0.9%。关键词:VVC;亮度残差;帧内预测;VTM16.0中图分类号:TN919.81文献标志码:A文章编号:1673-0062(2023)03-0046-07Improve Algorithm of VVC Intra Coding Based on Luminance ResidualWANG Fangbing1,LI Yue2,LIN Wenbin1,
4、2(1.School of Mathematics and Physics,University of South China,Hengyang,Hunan 421001,China;2.School of Computer Science,University of South China,Hengyang,Hunan 421001,China)Abstract:The versatile video coding(VVC)standard is jointly formulated by the jointvideo expert group(JVET).It follows the tr
5、aditional architecture of mixed block based co-dec and its predecessor high efficient video coding(HEVC).Compared with HEVC,theintra prediction function of VVC contains a large number of modifications,and the codingefficiency is greatly improved.In this paper,an improved intra coding algorithm based
6、 onluminance residuals is proposed on the basis of VVC.By reducing the number of rate-dis-tortion cost checks,the computational complexity is reduced and the intra frame coding ef-ficiency of VVC is improved while ensuring that the coding quality is not greatly affected.64第37 卷第3 期王芳冰等:基于亮度残差的 VVC 帧
7、内编码改进算法2023 年 6 月Under the VVC software version of VTM16.0,the experimental results show that under thesame configuration,the coding time of the improved algorithm can be reduced by27.03%,while the Bjntegaard-Delta rate can only be increased by 0.9%.key words:VVC;luminance residual;intra prediction;
8、VTM16.00 引 言随着显示技术的发展和对超高清视频需求的增加,视频应用不断向高帧速率和高分辨率发展。针对这一趋势,引入了一种新的视频编码标准,称为通用视频编码(versatile video coding,VVC)。VVC 是一种国际视频编码标准,与高级视频编码(advanced video coding,AVC)和高效视频编码(high efficient video coding,HEVC)相比,它具有更高的压缩能力。它由 ITU-T 视频编码专家组(video coding expert group,VCEG)和 ISO/IEC 运动 图 像 专 家 组(moving pictur
9、e expert group,MPEG)建立的联合视频专家组(joint video expertsteam,JVET)共同设计1-2。帧内预测是视频编码的主要研究领域之一。它利用图像的空间相关性来消除空间信息的冗余,实现视频数据的压缩。在 VVC 中,提出了许多新的帧内预测技术,包括模式相关帧内平滑(mode dependent intra smoothing,MDIS)、交叉分量 线 性 模 型(crosscomponentlinearmodel,CCLM)、位 置 相 关 帧 内 预 测 组 合(positiondependent intra prediction combination
10、,PDPC)、多参考线(multi reference line,MRL)帧内预测、帧内子分区(intra sub partition,ISP)、矩阵加权帧内预测(matrix weighted intra prediction,MIP)等3。帧内预测是 VVC 标准应用的基础,它发生在以下两种情况下:首先,为了确保随机访问能力(不包括逐行解码和刷新场景),只允许帧内预测而不允许帧间预测的帧被插入到每个视频序列中,即所谓的 I 帧。其次,对于视频帧中可能发生的局部时间场景变化,例如存在遮挡时,帧间预测很可能失效,需要使用帧内预测。在典型的视频序列中,虽然最常用帧间预测,但以帧内预测模式编码的块
11、占总比特率的很大一部分。有效的帧内预测算法通常可以减少在每个 I 帧中发生的比特率波动,因为它消耗高比特率。帧内预测技术在视频编码技术中起着重要的作用,对编码性能有很大的影响。优化帧内预测技术以提高编码效率是一项重要任务。1 相关工作1.1 VVC 帧内编码VVC 继承了经典的三步模式搜索方法,如图1 所示4。图 1 VVC 中帧内模式选择的流程图Fig.1 The flowchart of intra mode selection in VVC第一步称为粗糙模式决策(rough mode deci-sion,RMD),它使用 Hadmard 成本(Hadmard cost,Hcost)值从
12、67 个正常模式中选择 N 个候选模式,如图 2 所示。67 种正常模式包括两种非定向模式(DC 模式和 Planar 模式)和 65 种定向模式。这 N 个模式形成 RMD 模式列表,并根据 Hcost 按升序排序。N 根据编码单元(coding unit,CU)的大小被设置为 2 或 3。在第二个步骤中,从相邻CU 导出最可能模式(most probable mode,MPM)列表,并且通过 RMD 模式列表初始化 ISP 模式列表。然后,将 MPM 列表中的前 m 个模式与 RMD模式列表合并,以形成完整的模式列表(completemode list,CML)。根据相邻 CU 的模式是否
13、相同,m 分别设置为 1 或 2。因此,CML 的大小为 3、474第37 卷第3 期南华大学学报(自然科学版)2023 年 6 月或 5。第三步称为率失真优化(rate distortion opti-mization,RDO),它使用 RDO 过程从 CML 和 ISP模式列表中选择出率失真代价(rate-distortioncost,RD Cost)最小的模式为最佳模式。图 2 VVC 中的角度帧内预测模式Fig.2 Angular intra prediction modes in VVC1.2 快速模式决策算法有两种类型的快速模式决策算法。第一个是为 RMD 过程设计的。例如,H.Z
14、hang 等5为HEVC 编码器提出了一种快速模式决策方法。L.Gao 等6提出了两种快速内部预测算法,以减少率失真优化的候选模式的数量。L.L.Wang 等7提出了一种用于模式决策和信令处理的新的自适应模式跳过算法。T.Zhang 等8提出了一种基于梯度的方法,以减少 RMD 过程和 RDO 过程的候选模式。M.Jamali 等9提出了一种基于改进的边缘检测、考虑相邻块中的最相关模式和绝对变换差分和(sum of absolute transformed difference,SATD)代价分类的快速帧内模式决策方法。W.Jiang 等10提出了一种基于梯度的快速模式决策算法,以降低 HEV
15、C 的计算复杂性。参考文献5和参考文献6分别提出了一种渐进式搜索方法来计算部分预测模式的 Hcost,而参考文献7-10研究了纹理和模式之间的关系,仅研究了少数模式。第二种设计用于 RDO 过程。例如,M.Jamali等11提出了一种基于低复杂度绝对变换差成本之和预测内部模式 RDO 过程的新方法,以降低HEVC 内部模式决策的计算复杂性,同时节约编码时间。J.Tariq 等12提出通过融合 Hadmard 代价并使用由空间和时间相关性形成的统计推断来初始化候选模式列表,从而改进了 RMD 的快速模式决策策略。这些方法重新设计了 RDO 过程预测模型,以降低编码复杂度。简而言之,为 VVC 设
16、计低复杂度算法有三个挑战。首先,一系列新技术叠加在 VVC 内部编码中,以提高编码性能,然而,这些新模型并不总是提供比正常模型更准确的预测,这导致了巨大的计算冗余。第二,标准模式的选择不再局限于最近的参考线,这一点需要注意。第三,随着宽角度模型的采用,模型预测的类型显著增加。这导致了大量冗余模式预测,降低了预测模型的精度,并显著提高了编码复杂性。本文选择 VTM16.0 作为实验参考和测试软件,VTM16.0 集成了许多方法来降低帧内编码的复杂性,然而,通过使用下一节中提出的方法,仍然可以进一步降低帧内编码的复杂性。2 提出算法本节提出了一种预终止帧内预测算法,通过控制残差以减少 RDO 过程
17、中 RD Cost 检查的次数来降低计算复杂性,从而提高 VVC 的帧内预测效率。首先,建议使用 CU 的总体残差平均值来确定当前编码的 CU 是否提前终止后续模式的RDO 过程,然而,当总体残差平均值太大时,尽管可以有效地减少 VVC 的帧内编码时间,但这将导致图像编码质量有一定下降。因此,通过实验设置了一个阈值,以确保图像编码质量不受较大影响,达到编码质量和编码效率的平衡,通过该算法,得到了不错的实验结果。2.1 亮度残差算法为了降低 VVC 帧内编码的复杂性,设计了一种基于亮度预测值和亮度原始值来计算当前 CU的总体残差平均值的算法。为了计算总体残差平均值,应首先确定当前编码块的每个像素
18、的原始像素值和预测像素值之间的绝对差,如公式(1):R(x,y)=D(x,y)-Y(x,y)(1)式中:D(x,y)为当前 CU 的原始亮度值;Y(x,y)为当前 CU 的预测亮度值;R(x,y)为原始亮度值与预测像素值之间的绝对差值。根据 VTM 软件,量化参数(quantization pa-rameter,QP)的设置将影响 CU 的亮度预测值。因此,将 CU 的基本 QP 值作为计算平均残差的参数之一,如公式(2)84第37 卷第3 期王芳冰等:基于亮度残差的 VVC 帧内编码改进算法2023 年 6 月P(x,y)=R(x,y)Q/K(2)式中:Q 是设置的 QP 值;K 是用于对
19、QP 等级进行分类的参数。在本实验中,其值设置为 2。像素矩阵总和为:S=hy=0wx=0P(x,y)(3)式中:w 是当前 CU 的宽度,h 是当前 CU 的高度,并且有 0 xw,0yh。公式(4)为当前 CU 总体残差平均值的计算公式:A=Shw(4)表示当前 CU 原始值和预测值之间的总体残差的平均值。在计算当前 CU 总体残差平均值之后,使用阈值来平衡编码质量和编码复杂度。当平均残差值小于该阈值时,这意味着原始亮度值和预测亮度值之间的差很小,保证编码质量不受较大影响。2.2 快速决策算法在第一步 RMD 之后,从 67 个正常模式中选择 N 个候选模式以形成 RMD 列表。并且第二步
20、骤从相邻 CU 导出 MPM 列表,并且 ISP 模式列表由 RMD 模式列表初始化。然后,MPM 列表中的前 m 个模式与 RMD 模式列表合并以形成 CML。根据相邻 CU 的模式是否相同,m 分别设置为 1或 2。此时,预测模式的数量从 67 个大大减少到十几个,然后通过 RDO 检查预测模式以获得最佳模式。算法将在 RDO 过程前进行,进一步减少预测模式,从而减少 RDO 过程中 RD Cost 检查的计算次数,降低计算复杂性。在计算 CU 总体残差平均值之后,设置阈值来平衡编码质量和编码复杂度。当总体平均残差值小于该阈值时,意味着原始像素值与预测像素值之间的差异小,判断条件正确;否则
21、,判断条件错误。通过实验比较测试,当阈值设置为 4 时,可以获得最佳的实验结果,即,当目前的模式总体残差平均值小于 4 时,该模式将进入下一步的 RDO过程列表中,否则将其剔除。该算法可以大大减少 RDO 过程中 RD Cost 检查的次数,从而降低计算复杂性并提高编码效率。将改进算法命名为FMD,即 fast mode decision,改进的算法流程图如图 3 所示。图 3 本文提出的算法流程图Fig.3 The algorithm flow chart proposed inthis paper3 实验结果实验平台的 CPU 是 Intel i5-10400T 处理器,具有 8 G 内存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 亮度 VVC 编码 改进 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。