基于矿工大数据的不安全行为主题挖掘与语义分析.pdf
《基于矿工大数据的不安全行为主题挖掘与语义分析.pdf》由会员分享,可在线阅读,更多相关《基于矿工大数据的不安全行为主题挖掘与语义分析.pdf(4页珍藏版)》请在咨信网上搜索。
1、254dataJ.Safety in Coal Mines,2023,54(9):254-257.移动扫码阅读LI Yan,LIU Zhen,CHEN NanxiTopic mining and semantic analysis of unsafe behavior based on miner big2023,54(9):254-257李琰,刘珍救店正贝煤矿安全SafetyinCoal MinesSep.20232023年9 月No.9Vol.54煤防发全第5 4 卷第9 期DOI:10.13347/ki.mkaq.2023.09.035基于矿工大数据的不安全行为主题挖掘与语义分析李琰,刘
2、珍,陈南希(西安科技大学管理学院,陕西西安7 10 0 0 0)摘要:为科学防控煤矿安全事故,深度挖掘不安全行为数据隐藏的信息和知识;基于Py-thon算法、LDA主题模型和NetDraW工具,选取2 0 17 2 0 2 1年陕西省某大型煤矿集团的4 4 0 6 9条不安全行为数据进行分词处理、主题提取,绘制矿工不安全行为语义网络图并对矿工不安全行为语义网络的中心性进行分析;研究得出5 个矿工不安全行为高频主题和3个矿工不安全行为高发地点。关键词:矿工大数据;不安全行为;LDA;语义网络图;安全管理;主题挖掘;语义分析中图分类号:TD79文献标志码:B文章编号:10 0 3-4 9 6 X(
3、2 0 2 3)0 9-0 2 5 4-0 4Topic mining and semantic analysis of unsafe behavior based on miner big dataLI Yan,LIU Zhen,CHEN Nanxi(School of Management,Xian University of Science and Technology,Xian 710000,China)Abstract:In order to prevent and control coal mine safety accidents,we should deeply mine th
4、e hidden information and knowledgeof unsafe behavior data.Based on Python,LDA and NetDraw,44 069 pieces of unsafe behavior data of a large coal mine group inShaanxi Province from 2017 to 2021 are selected for word segmentation and topic extraction,and the miner unsafe behavior semant-ic network diag
5、ram is drawn to analyze the centrality of miner unsafe behavior semantic network.5 miners unsafe behavior high fre-quency topics and 3 miners unsafe behavior high incidence sites are obtained.Key words:miner big data;unsafe behavior;LDA;semantic network graph;safety management;topic mining;semantic
6、analysis目前,我国能源行业呈现“富煤、贫油、少气”的特点。煤炭资源储量高,开采成本与技术难度远低于石油、天然气,这决定了煤炭仍将在我国能源结构中占重要位置。信息技术高速发展、融合创新,推动了煤炭行业的数字化、信息化、智能化转型,也对煤矿企业运营管理和安全生产提出了新的挑战。同时,煤矿企业的安全信息感知能力极大提升,产生了海量的行为安全数据 2 。为此,将矿企生产实际和矿工行为数据相结合,运用文本挖掘技术对数据中蕴含的信息、知识和规律进行探究,研究矿工不安全行为,有助于解决企业安全数据膨胀、知识提取效率低等问题,有效提高矿企员工安全隐患洞察力,降低矿工不安全行为发生率。1不安全行为主题挖
7、掘1.1数据来源研究以某大型煤矿企业为研究对象,选择收稿日期:2 0 2 2-0 9-2 3责任编辑:谭威威基金项目:国家自然科学基金资助项目(5 16 0 4 2 16);教育部人文社科资助项目(2 1YJA630050);陕西省社会科学基金资助项目(2 0 2 0 R010);西安市社会科学规划基金资助项目(GL14,2 2 G L 38)作者简介:李(19 7 7 一),女,宁夏石嘴山人,教授,博士,从事矿业工程、安全技术与工程方面的研究工作。E-mail:6 32 0 5 8 17 1 q q.c o m255Safety in Coal MinesSep.20232023年9 月No
8、.9Vo1.54煤矿发全第9 期第5 4 卷2017一2 0 2 1年记录的不安全行为管控表作为数据来源,内容包括时间、班次、详细描述、风险及预警等级等字段。通过梳理、汇总、排序,共获得4 4 0 6 9 条安全数据。1.2文本预处理数据挖掘中,文本预处理不可或缺,与主题提取结果的科学性和准确性密切相关 3。使用LDA实现对矿工不安全行为的主题数据挖掘,自定义煤矿专业词汇库,保证分词、去停用词的各步操作最优,数据处理结果可靠。具体为:建立专业词库:根据煤炭行业法、煤矿安全规程、煤矿安全监察条例等开发自定义词库,避免有效词汇(如“安全意识”、“防护眼镜”等)被误分、停用 4 ;中文分词:在Pyt
9、hon开发环境中调用jieba程序包对“人员不安全行为详细描述”进行分词,并选择每篇TF-IDF得分最高的前10 0 个关键词 5 ;去停用词:使用line.strip函数删除文本中的停用词,过滤行为数据中的标点符号、无实际含义的功能词(“是”、“的”、“吗”、“了”等)、矿工姓名、日期等,提高数据挖掘的精度。1.3主题提取结果采用Perplexity(困惑度)来确定LDA模型最优主题数 6 ,确定挖掘12 个相关主题。根据确定的最优主题数,在LDA模型拟合步骤中设置numtopic和alpha参数,得出矿工不安全行为主题提取结果见表1。因“人员不安全行为详细描述”大部分文本较短,选择挖掘每个
10、主题Top5的关键词表1矿工不安全行为主题Table 1Theme of miners unsafe behavior主题主题词1安全带高空作业大巷升井不系2未戴此人防护眼镜佩戴逆行3井下安全帽联巷回顺私自4入井携带班长吸烟口罩5冲洗电缆检查用水带班6班前会迟到参加早班上岗7安全帽不系工作面支护迟到早退8作业神号入井现场帽带9岗位机头脱岗胶带睡觉10上岗作业疲劳精神恍您人员11车辆驾驶交接班驾驶室熄火12作业危险源辩识检修支架根据不安全行为管控表中的人员不安全行为详细描述和主题提取结果,将主题词进行整合归纳。例如主题2 的主题词“未戴”、“佩戴”、“防护眼镜”等,对应主题内涵可以总结为“未戴防
11、护眼镜”;主题5 的主题词包括“用水”、“冲洗”、“电缆”等,相应的主题内涵可概括为“用水冲洗电气设备”;主题6 的主题词包括“班前会”、“参加”、“迟到”等,对应主题内涵可总结为“参加班会迟到”;主题10 的主题词包括“上岗”、“疲劳”、“精神恍”等,相应的主题内涵总结为“疲劳作业”。通过研究相关文献,查阅煤矿安全规程、工伤亡事故分类标准及集团内部规章制度,将上述12个主题划分为“三违”管理制度等规章制度,将主题划分为“忽视个人防护”、“忽视管理条例”、“违法违规操作”、“忽视作业流程”、“分散注意力”5 大类,矿工不安全行为主题内涵及主题类型见表2。表2 矿工不安全行为主题内涵及类型Tab
12、le 2TTheme connotation and types ofminersunsafebehavior编号内涵类型一不系安全带忽视个人防护2未戴防护眼镜忽视个人防护3私自摘掉安全帽忽视个人防护4人井携带违规物品忽视管理条例5用水冲洗电气设备违法违规操作参加班会迟到忽视管理条例7不戴安全帽忽视个人防护8作业后未及时清理现场忽视作业流程工作时串岗、脱岗、睡觉分散注意力10疲劳作业分散注意力11驾驶车辆不合规范违法违规操作12作业前不进行检修和危险源辨辩识忽视作业流程2不安全行为语义分析2.1语义网络构建语义网络是节点和有向弧组成的图示,可以结构化描述事件的定义及客体之间的相互关系 7 。基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 矿工 数据 不安全 行为 主题 挖掘 语义 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。