面向视频数据的时空伴随模式挖掘算法.pdf
《面向视频数据的时空伴随模式挖掘算法.pdf》由会员分享,可在线阅读,更多相关《面向视频数据的时空伴随模式挖掘算法.pdf(8页珍藏版)》请在咨信网上搜索。
1、2023 08 10计算机应用,Journal of Computer Applications2023,43(8):2330-2337ISSN 10019081CODEN JYIIDUhttp:/面向视频数据的时空伴随模式挖掘算法张潇誉1,于自强1,2*,刘承栋1,李博涵3,靖常峰4(1.烟台大学 计算机与控制工程学院,山东 烟台 264005;2.自然资源部城市国土资源监测与仿真重点实验室,广东 深圳 518034;3.南京航空航天大学 计算机科学与技术学院,南京 211106;4.中国地质大学(北京)信息工程学院,北京 100083)(通信作者电子邮箱)摘要:时空伴随模式是具有时空伴随关
2、系的视频对象组合。为了从海量视频数据中快速发现符合查询条件的时空伴随模式,提出一种基于三重剪枝匹配策略的时空伴随模式发现算法MPA。首先,利用已有的视频对象识别和跟踪模型对视频对象进行结构化提取;然后,对提取的连续帧中大量重复出现的视频对象进行压缩存储并构建索引;最后,设计基于前缀树的时空伴随模式发现算法,以快速发现符合查询条件的时空伴随模式。在真实数据集和合成数据集上的实验结果表明,与暴力搜索算法(BFA)相比,所提算法的效率提高了30%左右,且数据量越大,效率提高越明显。因此,所提算法能够快速发现海量视频数据中满足查询条件的时空伴随模式。关键词:视频对象;结构化;时空伴随模式;索引结构;剪
3、枝策略中图分类号:TP391.3 文献标志码:ASpatial-temporal co-occurrence pattern mining algorithm for video dataZHANG Xiaoyu1,YU Ziqiang1,2*,LIU Chengdong1,LI Bohan3,JING Changfeng4(1.School of Computer and Control Engineering,Yantai University,Yantai Shandong 264005,China;2.Key Laboratory of Urban Land Resources Mon
4、itoring and Simulation,Ministry of Natural Resources,Shenzhen Guangdong 518034,China;3.College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing Jiangsu 211106,China;4.School of Information Engineering,China University of Geosciences,Beijing,Beijing 100083
5、,China)Abstract:Spatial-temporal co-occurrence patterns refer to the video object combinations with spatial-temporal correlations.In order to mine the spatial-temporal co-occurrence patterns meeting the query conditions from a huge volume of video data quickly,a spatial-temporal co-occurrence patter
6、n mining algorithm with a triple-pruning matching strategy Multi-Pruning Algorithm(MPA)was proposed.Firstly,the video objects were extracted in a structured way by the existing video object detection and tracking models.Secondly,the repeated occurred video objects extracted from a sequence of frames
7、 were stored and compressed,and an index of the objects was created.Finally,a spatial-temporal co-occurrence pattern mining algorithm based on the prefix tree was proposed to discover the spatial-temporal co-occurrence patterns that meet query conditions.Experimental results on real and synthetic da
8、tasets show that the proposed algorithm improves the efficiency by about 30%compared with Brute Force Algorithm(BFA),and the greater the data volume,the more obvious the efficiency improvement.Therefore,the proposed algorithm can discover the spatial-temporal co-occurrence patterns satisfying the qu
9、ery conditions from a large volume of video data quickly.Key words:video object;structuration;spatial-temporal co-occurrence pattern;index structure;pruning strategy0 引言 当前,海量视频数据蕴含丰富的时空信息,快速查找一段视频中满足用户指定时空伴随关系的视频对象组合对于若干视频查询具有重要意义。例如,办案人员根据已知案情线索,急需在案发地周围监控视频中查找“2个黑衣男子在某银行周边多个地点结伴行走的视频片段”;又如,自动驾驶研发
10、人员需要从视频库中快速查找“自动驾驶车辆与前方车辆距离小于10 m且持续行驶5 s以上的视频片段”用于自主导航模型调优。本文将这种满足用户指定时空伴随关系的视频对象组合称为时空伴随模式,并研究基于结构化查询思想的视频数据时空伴随模式发现算法。当前,计算机视觉和机器学习领域对视频内容检索问题进行了大量研究。其中,基于自然语言查询语义的视频内容检索问题1-7与本文研究问题较为相似,即给出自然语言描述的查询语义,从给定的视频中查找满足查询语义的视频片段。例如,给定查询文本“一个人在打篮球”时,现有检索系统将根据整个查询文本的视频特征,或者关注于文本与视频中所表现的实体(如“人”“篮球”)来计算合适的
11、视频片段6;然而,该类方法的相关工作并不能直接用来解决本文要研究的问题,文章编号:1001-9081(2023)08-2330-08DOI:10.11772/j.issn.1001-9081.2022101566收稿日期:20220926;修回日期:20221108;录用日期:20221111。基金项目:国家自然科学基金资助项目(62172351)。作者简介:张潇誉(1999),女,山东枣庄人,硕士研究生,主要研究方向:视频数据处理;于自强(1984),男,山东青岛人,副教授,博士,CCF会员,主要研究方向:数据库、数据挖掘;刘承栋(2000),男,山东淄博人,硕士研究生,主要研究方向:视频数
12、据结构化查询;李博涵(1979),男,副教授,博士,CCF高级会员,主要研究方向:时空数据库、知识图谱、自然语言处理;靖常峰(1979),男,山东济南人,教授,博士,主要研究方向:城市运行管理物联网技术、城市时空大数据建模、时空分析与挖掘。第 8 期张潇誉等:面向视频数据的时空伴随模式挖掘算法因为此类模型大多基于深度神经网络的端到端的学习框架,模型所能应对的查询类型与标注的训练数据紧密相关。现实中,受限于标注的训练数据的类型及数量,此类模型不足以支持面向视频数据复杂变化的查询需求。考虑到上述原因,本文拟采用结构化查询思想设计视频数据的时空伴随模式发现算法。当前,视频数据中的视频对象检测和跟踪算
13、法8-15取得了良好效果,能较准确地从视频数据中识别并提取不同视频对象的位置、属性等信息,这为本文从视频数据中提取和识别视频对象及属性,并量化视频对象之间的时空关系提供了必要的技术条件。因此,本文利用已有的视频对象识别和跟踪模型,对视频中每一帧的所有视频对象进行结构化提取,获取每个视频对象的标识、属性以及其在对应视频帧中的位置,从而实现视频数据时空伴随模式查询问题的结构化查询语义表述。例如,一个要求至少有一个人和一辆车同时出现的查询可以表示为:SELECT*OVER(ORDER BY FIDRANGE BETWEEN INTERVAL 4 FRAMESPRECEDING AND CURRENT
14、 ROW)FROM VR WHERECOEVAL(person 1 car 1,duration=3,a,b OID:distance(a,b)5,angle(a,b)30)在这个例子中,假设该查询是基于一个由4帧组成的滑动窗口进行的,并且要求视频对象共同出现的帧数至少为3,要求共同出现的视频对象之间距离小于5 m且两两之间方位角度要在30内。为了能够快速得到满足结构化查询语义的时空伴随模式,本文提出了基于滑动窗口策略的视频对象 3 层索引(Video Objects Triple Index,VOTI)结构和视频对象剪枝匹配算法。首先采用滑动窗口策略将整个视频划分为多个滑动窗口,每个窗口大小
15、固定,且每个查询所涉及的时空伴随模式出现的连续帧数不超过视频滑动窗口的大小。VOTI的第一层是视频窗口,每个窗口记录该窗口中每一类视频对象的属性及其数量;第二层为每个视频窗口的视频帧,每个视频帧中同样记录该帧中所包含的视频对象的属性及其数量;第三层是每个视频帧所对应的完全图,该完全图中每个视频对象表示为一个顶点,任意两个顶点之间存在一条边,边的权重为两个对应视频对象的距离和相对位置。基于该索引结构,本文提出基于三重剪枝匹配策略的时空伴随模式发现算法MPA(Multi-Pruning Algorithm)。该算法首先根据待查询的时空伴随模式中视频对象的属性、数量和出现的视频帧数对无效视频窗口进行
16、剪枝,并将剩余可能包含时空伴随模式的视频窗口称为候选视频窗口;然后,根据待查询的视频对象数、属性对每个候选视频窗口中的视频帧进行剪枝,得到候选视频帧;最后,再根据每个候选视频帧所对应的完全图对视频对象的距离和相对位置等时空信息进行比对,最终找到满足条件的时空伴随模式。本文的主要工作如下:1)提出了一种面向视频数据的时空伴随模式发现问题,在对视频对象时空关系进行量化的基础上,充分考虑视频对象时空关系在时间维度上的演变特性,提出了针对该问题的高效查询策略。2)在对视频对象属性结构化提取和对视频对象之间时空关系量化表示的基础上,提出了一种面向视频窗口、视频帧和视频对象的三重索引结构,实现对视频窗口、
17、视频帧和视频对象的隶属关系、海量视频对象属性信息,以及视频对象之间时空关系的融合索引。3)基于三重索引结构,提出了一种面向视频窗口、视频帧和视频对象的多级剪枝策略,实现了搜索空间的快速剪枝;然后提出了一种基于Prefix Tree的时空伴随模式的查找匹配算法,实现视频数据时空伴随模式的快速发现。4)在合成数据集和真实数据集上开展了大量的实验,测试了不同参数对算法性能的影响,验证了算法的有效性。1 相关工作 视频内容检索是计算机视觉领域的一个重要问题。早期视频检索工作通常采用视频划分(Video Segmentation)或特征提取方法(Feature Extraction)对视频内容进行检索1
18、6-19,基本思想是提取视频的底层视觉特征(Low Level Visual Feature)并构建视觉特征索引,然后基于特征索引查找与给定场景较为相似的视频片段。近年来,基于自然语言查询语义的特定视频场景搜索(Ad-hoc Video Search,AVS)问题被深入研究1-7。Awad 等1在TRECVID2016中首先提出AVS问题,将它作为测试任务之一,并给出了这一问题的测试数据集、测试方法和评价准则。针对AVS问题,Markatopoulou等2提出一种仅利用自然语言查询语义的特定视频场景搜索算法;Lu等3为支持视频事件的关键字查询,构建一个巨大的概念库用于记录视频中对视频对象、场景
19、、行为、活动等进行标注的概念,以减小文本查询语义与视觉标注概念映射到同一语义空间时的距离;Gordon等4提出面向移动视频的交互式问答问题,并提出一种多级交互记忆网络;Das等5提出一种面向动态场景虚拟视频的呈现式问答问题,帮助智能体对周围环境进行感知;陈卓等6提出基于视觉-文本关系对齐的图卷积框架,分别构建文本关系图与视觉关系图表示查询文本与视频片段中的语义关系,然后通过跨模态对齐的图卷积网络评估文本关系与视觉关系的相似度,从而更加精准地检索视频片段;王美珍等7提出一种视频时空检索方法,通过检索最少数量的视频画面检索视频对象包括时间、空间和方向在内的时空信息。上述视频检索模型能够根据自然语言
20、描述的查询条件从视频中查找相关的视频片段,但是难以直接解决本文提出的视频数据时空伴随模式发现问题;因为此类模型大多是采用端到端的学习框架,所能应对的查询类型与标注的训练数据紧密相关,而对于现实中复杂多变的查询问题,不会有大量标注的训练数据集与其一一对应,解决实际问题范围有限。近期一些有关视频查询处理的相关工作主要集中在对视频数据进行声明式查询处理的不同方面20-24。例如,Kang等20提出一种使用低成本过滤器过滤帧的方法,以达到查询处理目的。随后,他们21-22提出了针对视频数据上特定类型聚合的查询处理技术。Bastani等23提出将查询处理与对象跟踪相结合以提高效率。Chen等24考虑了在
21、视频数据上评估合取范式(Conjunctive Normal Form,CNF)时间查询的问题,引入了标记帧集(Marked Frame Set)和稀疏状态图(Sparse State Graph)方法维护上下文,旨在减少处理新帧的开销并促进CNF查询评估。但在视频查询处理中,并没有对视频对象模式匹配算法的研究,因此本文拟采用结构化查询思想设计2331第 43 卷计算机应用视频数据的时空伴随模式发现算法,充分考虑视频对象时空关系在时间维度上的演变特性,提出针对该问题的高效查询策略。另外,随着对目标检测问题的深入研究,视频中多目标跟踪问题的研究11-15成果显著。这些研究工作充分利用深度卷积神经
22、网络在目标检测方面的优势,先对视频进行目标检测,然后根据时间和空间关系建立目标之间的联系,实现目标追踪过程11-12。为了简化目标追踪过程,一些工作13-15将目标检测和跟踪两个过程同时进行,能够有效降低多目标跟踪问题的计算复杂性。这为本文从视频数据中提取和识别视频对象及其属性,并量化视频对象之间的时空关系提供了必要的技术条件。2 相关定义 本文提出一种面向视频数据的时空伴随模式发现问题,针对查询在给定一段时间内同时出现的对象集合,下面将对相关概念和时空伴随模式发现的问题加以形式化说明。定义1 视频帧。将一段视频V看作一个有限的帧序列,V=f0,f1,fi-1,fi,fN-1表示视频V由N帧组
23、成,即N是视频的总长度,视频V的第i+1帧所对应的编号为fi。定义2 视频对象。应用目标检测和追踪算法14,25从每一帧fi中提取一组对象Oi,并为每一个oi Oi提取其所在帧的 编 号(FID)、自 身 编 号(OID)、类 别(Class)、相 关 属 性(Attribute)、边框(Border)等信息,本文将这种从视频中提取的对象(oi)定义为视频对象。这样就在视频V中获得了一个结构化关系VR。如图1所示,在#4帧中,应用对象检测和跟踪算法,获得了两个唯一的对象,OID为1和3。之后将这样的信息存储为VR关系中的两行:一行用于类“car”的对象1,另一行用于类“person”的对象3,
24、这两行都是在帧FID=4时生成的。图1视频数据转化为结构化关系Fig.1Transforming video data into structured relationships定义3 视频窗口。本文采用滑动窗口策略将整个视频划分为多个滑动窗口,每个窗口大小固定,用I表示,每个窗口Ij包含w帧f0,f1,fw-1。定 义 4 时 空 伴 随 模 式。给 定 视 频V=f0,f1,fi,fN-1,若O满足以下条件,那么视频对象组合O就称为时空伴随模式。1)o O,o在帧序列F=fi,fi+1,fi+m每一帧都出现,m不小于用户指定数值。2)oi,oj O,在 帧 序 列F任 意 一 帧 中 满
25、足dist(oi,oj)d,angle(oi,oj),其中dist(oi,oj)表示视频对象oi,oj间的欧氏距离,angle(oi,oj)表示视频对象oi,oj间的夹角(以水平方向为基准),d、为用户指定数值。3 视频数据结构化索引 本文以视频对象为基本存储单元,从“视频对象-视频帧-视频窗口”3个层面,对提取的连续帧中大量重复出现的视频对象进行压缩存储并构建索引,从而支撑上层查询算法对视频对象及其时空关系的快速访问。3.1构建同一帧中视频对象空间关系索引首先获取视频每一帧的数据,将同一帧中的每个视频对象看作一个顶点,所有顶点构成一个完全图。完全图是表示为G=(O,E)的无向完全图,其中O为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 视频 数据 时空 伴随 模式 挖掘 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。