基于多孔卷积神经网络的图像空间结构信息细节表征.pdf
《基于多孔卷积神经网络的图像空间结构信息细节表征.pdf》由会员分享,可在线阅读,更多相关《基于多孔卷积神经网络的图像空间结构信息细节表征.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 37 卷 第 1 期2024 年 03 月Vol.37 No.1Mar.2024盐城工学院学报(自然科学版)Journal of Yancheng Institute of Technology(Natural Science Edition)基于多孔卷积神经网络的图像空间结构信息细节表征徐叶军(苏州工业园区服务外包职业学院 生物科技学院,江苏 苏州 215123)摘要:针对传统图像空间结构信息表征方法存在细节表征模糊度较高、信息训练损失较高等问题,提出一种新的基于多孔卷积神经网络的图像空间结构信息细节表征方法。该方法通过图像空间结构信息细节相似性度量,并以图像的形状、颜色和纹理特征对图像
2、空间结构信息细节进行编码,再去除图像冗余信息,利用多孔卷积神经网络对图像空间结构的深度信息进行融合,从而完成图像空间结构信息的细节表征。实验结果表明,基于多孔卷积神经网络的图像空间结构信息细节表征方法在模糊度、训练损失、图像相似性等方面都比传统的3种方法优越,能够清晰地表征图像空间结构信息。关键词:多孔卷积神经网络;图像空间结构;细节表征;冗余信息;深度信息融合中图分类号:TP391 文献标志码:A 文章编号:1671 -5322(2024)01 -0020 -06大数据时代,图像量越来越大,图像信息获取难度越来越高1。要准确地提取图像,就必须对图像空间结构信息细节进行表征。目前,对图像空间结
3、构信息细节表征的研究较多,但这些方法不仅计算量较大,空间结构信息估计效率也较低,导致图像空间结构信息细节表征较模糊2-3。为此,本文设计一种基于多孔卷积神经网络的图像空间结构信息细节表征方法,以解决目前存在的问题。多孔卷积神经网络是一种仿造生物视觉机制构建的包含计算且具有深度结构的前馈神经网络,可以进行监督学习与非监督学习,还能够深度考虑图像的空间细节信息,较好地提取出图像结构上的重要特征,因此利用多孔卷积神经网络对图像空间结构信息细节进行表征具有重要的实际意义。1图像空间结构信息细节表征方法1.1图像空间结构信息细节相似性度量基于多孔卷积神经网络的图像空间结构信息细节表征框架如图1所示。为提
4、升图像空间结构信息细节表征效果,需要度量图像空间结构信息细节相似性4。图像空间结构信息细节相似性度量具体步骤如下:(1)将待表征的图像集,通过多孔卷积神经网络结构输出变换参数;图1 图像空间结构信息细节表征框架Fig.1 Detail characterization framework of image spatial structure informationdoi:10.16018/32-1650/n.202401004收稿日期:2023-06-30作者简介:徐叶军(1982),男,江苏南京人,副研究员/高级工程师,硕士,主要研究方向为计算机应用技术。徐叶军:基于多孔卷积神经网络的图像空
5、间结构信息细节表征第 1 期(2)对变换参数进行仿射变换,实现正向坐标映射,得到输入图像的采样网络T;(3)对采样网络 T 进行双线性差值技术处理,得到变换后的图像b。(4)为减少正向变换时产生的信息损失,对图像b进行逆向坐标映射。假设(xt,yt)对应输入图像的像素坐标,(xb,yb)对应输出图像的像素坐标,变换过程为(xt,yt)=N(xb,yb),(1)式中:代表仿射变换;N()xb,yb代表逆向坐标映射变换。(5)对经仿射变换处理后的输入图像b中的像素值,根据坐标映射的变换关系填充到相应位置,得到真实像素值。相似性度量后的图像表达式为V=a (xi-),(2)式中:V代表原图坐标点的像
6、素值;a代表原图像真实像素值;代表卷积层中当前层与上一层的特征参数;xi代表输入图像中第i个特征图的卷积核;代表图像b的逆向坐标映射过程中所使用的参数。经过对待表征图像空间结构信息的相似性度量,可以增大具有更高激活值的显著区域的概率,为图像空间结构信息细节表征提供基础。1.2图像空间结构信息细节编码根据图像空间结构信息细节相似性度量结果,通过图像的形状、颜色和纹理特征对图像空间结构信息细节进行编码。首先提取图像的形状特征,并用形状偏心率来描述。形状偏心率计算公式为Z=aV 100%,(3)式中:Z为nn区域内形状偏心率,%;为图像特征提取参数;为图像的形状特征。在提取图像的形状特征后,再对图像
7、的纹理特征进行提取,以表征图像表面信息与周围环境的关系。为了提取纹理图像中辨识能力较强的特征作为检测单元,采用 HGOOP描述图像纹理特征,计算公式为Q=ZAm,(4)式中:Q代表纹理特征提取时的高斯函数;A代表图像的中心像素点;v代表图像局部纹理结构特征;m代表图像灰度级值。在对图像的纹理特征进行提取后,再来提取表征图像空间结构的颜色特征5。为提取图像空间结构的颜色特征,需建立颜色空间模型,以便更好地捕捉不同的颜色特征。本文将 DFO颜色空间方法应用到颜色空间模型中,DFO颜色空间如图2所示,其中D代表颜色,F代表图像色彩的深浅度,O代表图像亮度。替换图像对应的像素值以表征图像空间结构的颜色
8、信息,替换公式为r=Q H ,(5)式中:r为图像空间结构的颜色信息;H为表征图像空间信息时设定的像素间的最大距离,cm;为图像颜色等级。在完成图像形状特征、纹理特征和颜色特征提取后,再按照图像形状特征、纹理特征和颜色特征对图像空间结构信息细节进行编码,公式为=r q|Z,Q,r|,(6)式中:代表图像空间结构信息细节编码;q代表细节编码因子。1.3图像空间结构信息细节表征在图像空间结构信息细节相似性度量及编码过程中包含大量冗余信息6,影响图像空间结构信息细节表征。另外,在图像采集、传输或处理过程中引入的随机干扰,会降低图像的质量,使图像变得模糊、失真或难以识别。因此在图像空间结构信息细节表征
9、前,需要去除图像的冗余信息与噪声信息,去除过程为g(x,y)=d(x,y)+(x,y),(7)式中:g(x,y)代表实际图像;d(x,y)代表无噪声图像7;(x,y)代表添加的噪声信息。在实际图像经过冗余信息与噪声处理后,退图2 DFO颜色空间Fig.2 DFO color space21第 37 卷盐城工学院学报(自然科学版)化为含噪图像,因此利用多孔卷积神经网络深层考虑含噪图像与去噪图像之间的关系。多孔卷积神经网络结构如图38所示。图3网络结构中包括输入层、输出层和反卷积子网。在卷积网络中,网络隐含层由特征图组成,网络输入层不限制图像大小,因此不需要处理图像大小就可以将含有噪声的图像从输入
10、层输入9。在图像输入多孔卷积神经网络后,使用55的卷积核对图像进行卷积操作,为待采样图像添加偏置,形成C1层,添加偏置后的网络包含32位特征图9,待训练的参数个数为55132+32;然后减小卷积核到33,并增加特征图数量32个,再将特征图与上一层的特征图进行连接,形成含有64个特征图的C2层,并将C2层与C1层对应生成64 个特征图,此时需要训练的参数个数为 116432+32;在上述 C1层经过反卷积操作生成 C2层的基础上,增大卷积核大小为55,并将输出特征图大小设置为1,此时反卷积输出的结果就是网络输出层输出的去噪图像。在图像空间结构信息的噪声处理完成后,就可以对图像空间结构深度信息的特
11、征进行融合10。根据上述获得的图像纹理特征、颜色特征和形状特征性质,定义图像特征融合的5种基本结构单元,如图4所示。在对图像融合时,从点(0,0)开始,用33的正方形自上而下从左到右地移动,若有结构元素与图4中的任意一个相同,则保留该值;若不同,则放弃,继续进行融合。在上述图像融合的基础上,对图像空间结构信息进行相似性度量11-12。由于欧氏距离可以有效地衡量连续图像中相邻点之间的差异程度,从而获取图像中的细节信息。因此,采用欧氏距离衡量图像中各个点之间的绝对距离,计算公式为13L=g(x,y)h ,(8)式中:L 为多维空间中图像点之间的绝对距离,cm;h 为图像像素中较小的权系数;为图像数
12、据集。根据上述计算结果,将图像颜色、形状、纹理特征融合14-15,并将融合结果表征在多孔卷积神经网络结构框架中;激活多孔卷积神经网络结构中已存储目标的表征16-17,从而完成图像空间结构深度信息表征。2图像空间结构信息细节表征评价指标图像空间结构信息细节表征评价指标有 3种,分别是模糊度、训练损失和图像相似性。输入CCCSSS输出.输入层输出层反卷积子网 网络隐含层图3 多孔卷积神经网络结构Fig.3 Porous convolution neural network structure a)方向0b)方向90c)方向45d)方向135e)无方向a 0方向 a)方向0b)方向90c)方向45d
13、)方向135e)无方向d 135方向 a)方向0b)方向90c)方向45d)方向135e)无方向b 90方向 a)方向0b)方向90c)方向45d)方向135e)无方向e 无方向 a)方向0b)方向90c)方向45d)方向135e)无方向c 45方向图4 图像特征融合的特征单元Fig.4 Feature units of image feature fusion22徐叶军:基于多孔卷积神经网络的图像空间结构信息细节表征第 1 期2.1模糊度模糊度是反映图像质量的重要指标,对图像质量的影响最为严重。通常来说,模糊度越高,图像越不清晰,图像处理以及接收过程越困难,图像空间结构信息细节表征效果越差;
14、反之,模糊度越低,图像空间结构信息细节表征效果越好。模糊产生的原因很多,一般用通用的数学模型来表示图像模糊程度,具体计算公式为g(x,y)=f(x,y)+n(x,y),(9)式中:f(x,y)表示原始图像;表示扩散点函数;表示卷积;n(x,y)表示随机噪声,dB。2.2训练损失目前大部分基于神经网络的图像信息研究都是基于MMSE准则,对应的损失函数为W(,Y;)=c()Y;Y-,(10)式中:代表目标图像的时频特征输入;Y代表带噪图像的时频特征输入;代表网络参数,由权重矩阵和偏置矩阵组成;c(Y;)代表网络的输出,可以理解为掩蔽估计或者增益估计。2.3图像相似性通常使用离线训练神经网络最后一层
15、输出的第1帧模板特征和待检测图像特征计算相似性响应R,计算公式为R=u1 xt+,(11)式中:R为相似性响应;u1、xt分别为第1帧模板图像和第t帧待检测图像经过网络最后一层的特征映射图;为偏置项。3实验过程及结果分析3.1实验过程为了验证基于多孔卷积神经网络的图像空间结构信息细节表征方法的有效性,在MATLAB平台利用 DIDHFOH2、NDSkk8 和 MATLAB 深度学习库,将来源于 Pascal VOC 数据集的 1 000个训练集(包含80个物体类别共1 000个分辨率均为 640480的训练图像),随机分为 5组,分别利用基于多孔卷积神经网络的图像空间结构信息细节表征方法与文献
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多孔 卷积 神经网络 图像 空间结构 信息 细节 表征
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。