基于YOLO v5的工人玩手机行为检测方法研究.pdf
《基于YOLO v5的工人玩手机行为检测方法研究.pdf》由会员分享,可在线阅读,更多相关《基于YOLO v5的工人玩手机行为检测方法研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月南京工程学院学报(自然科学版)().:./.投稿网址:/.基于 的工人玩手机行为检测方法研究林宝华刘 坤朱一帆王 晓(南京工程学院自动化学院 江苏 南京)摘 要:为规范工人生产行为、减少安全事故发生提出一种监控工人使用手机行为检测算法.该算法以 模型为基础对其网络结构和损失函数进行改进.首先优化主干网络将 和 结构引入浅层网络增加浅层特征的提取然后在主干网络与特征聚合网络之间构建 注意力机制层过滤冗余信息最后选取 损失函数代替 损失函数提高模型收敛速度与检测结果的定位精度.通过自建工人使用手机行为数据集分别对 原模型、改进模型以及主流模型进行对比.试验结果表明在人体和手机
2、目标检测中改进模型有更好的检测精度和检测速度.关键词:行为检测 注意力机制损失函数中图分类号:收稿日期 修回日期 作者简介 林宝华 硕士研究生 研究方向为图像处理、计算机视觉.引文格式 林宝华 刘坤 朱一帆 等.基于 的工人玩手机行为检测方法研究 .南京工程学院学报 自然科学版 .工人在各类操作环境中都有相应的操作行为规范要求正确的操作行为不仅能保证工作效率和产品质量还能避免重大安全事故的发生保障操作人员的生命安全.智能手机作为新时代的产物广泛应用于日常生活和工作中吸引了工人的注意力从而增加了安全隐患发生的概率.为了确保工人在参与生产的过程中能够专心工作减少手机的使用较为常见的做法是在工厂内安
3、装摄像头南京工程学院学报(自然科学版)年 月监控工人的行为由监管人员来监看和提醒.随着社会自动化程度的不断提高使用人力进行行为监督在安全性和高效性上的弊端都愈加明显.由人力监看视频存在反馈周期较长、标准不一致、业务不熟悉等问题并且人力难免会出现疲劳、松懈等情况造成监看疏漏.随着人工智能的发展基于深度学习的检测方法逐渐替代了人力监管成为当下研究热点.文献基于 目标检测算法对视频中的人体与手机信息进行提取联合手机目标直方图分布信息判断在岗员工是否存在玩手机行为文献采用神经网络对课堂视频中的学生与手机目标坐标信息进行回归通过手机目标边界框与学生目标边界框重叠面积来判断学生是否有玩手机行为文献通过图卷
4、积对人物关节点进行特征提取引入 视频背景建模算法完成手部区域的动作判别实现课堂玩手机、拍照、看时间行为的区分 文 献 通 过 增 加 属 性 分 类 器 来 改 进目标检测算法利用行为属性特征实现图像中打电话行为的检测文献 基于 对视频中的行人候选区域进行提取构建 分类网络完成打电话和抽烟行为的分类.这些模型主要应用于成像清晰场景且模型复杂度较高难以满足实时检测的需求.本文应用场景为工厂生产区域的视频监控手机目标相对于整个监控画面占比较小存在分辨率低、检测物体与背景颜色对比度低等问题.针对存在的问题提出改进 目标检测算法用于检测工厂监控视频中是否存在工人使用手机的行为方便管理人员及时处理减少安
5、全事故的发生.模型介绍及改进.算法介绍 系列目标检测算法为单阶段目标检测算法可直接回归输入图像的类别置信度与坐标信息.目前 网络模型有深度与宽度不断递增的 、和 四种版本本文采用的基准模型为 .网络结构可分为主干模块()、特征融合模块()、预测模块()三个部分.模块包含、和 结构主要实现目标特征的提取.结构通过切片操作将平面信息转换到通道维度能很大程度地减少信息损失(见图()结构中使用残差连接缓解深度神经网络中梯度消失问题 结构通过不同大小的池化核进行最大池化提高网络感受野分离出显著的上下文特征(见图().模块采用 与 相结合结构通过下采样、上采样和堆叠操作将主干网络获得的特征反复提取能够获得
6、较强的语义信息和空间信息.模块包含先验框对应的位置、置信度和类别信息用于计算损失函数和预测结果.()结构()结构图 包含结构.网络结构优化.主干网络优化手机目标存在尺寸小、监控视角下成像像素低、细节信息少等问题特征在下采样过程中容易丢失故手机小目标信息主要集中在浅层网络中.为防止手机目标信息流失在主干网络前 个 模块之间引入 结构和 来增加对浅层特征的提取在不过多增加模型复杂度的同时提高小尺寸目标的检测性能.使用现有的结构和方法通过新的架构和优化策略训练模型在 数据集上实现新的准确率.结构示意图如图 所示.第 卷第 期林宝华等:基于 的工人玩手机行为检测方法研究图 结构示意图 包含()卷积、激
7、活函数和 ()模块.传统卷积核的通道数与输入特征的通道数相同而 卷积的卷积核通道数固定为 个即一个通道只被一个卷积核卷积.卷积相比于传统卷积大大减少了运算量和参数的数量控制了模型复杂度的增加.注意力机制工厂内光线偏暗导致目标与背景区分不明显在对人体与手机目标检测过程中易出现漏检、错检问题.视觉注意力机制能够学习到目标特征在特征图中重要程度关系从而增加目标特征在整个特征图中的权重提高检测物体准确率.在 与 之间引入卷积注意力模块()注意力放大主干网络传出的三个特征层中的目标特征权重保证在特征聚合网络中传播的信息更有效.包含通道注意力模块()和空间注意力模块()能够自适应关注目标的通道信息和平面信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于YOLO v5的工人玩手机行为检测方法研究 基于 YOLO v5 工人 手机 行为 检测 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。