一种面向网站内容安全的分布式监控系统的设计与实现_田柳.pdf
《一种面向网站内容安全的分布式监控系统的设计与实现_田柳.pdf》由会员分享,可在线阅读,更多相关《一种面向网站内容安全的分布式监控系统的设计与实现_田柳.pdf(3页珍藏版)》请在咨信网上搜索。
1、本栏目责任编辑:代影网络通信与安全Computer Knowledge and Technology电脑知识与技术第19卷第4期(2023年2月)第19卷第4期(2023年2月)一种面向网站内容安全的分布式监控系统的设计与实现田柳1,龚光军1,林黄智2(1.安徽职业技术学院 汽车工程系,安徽 合肥 230011;2.安徽职业技术学院 机电工程系,安徽 合肥 230011)摘要:为实现网站内容安全的高效准确监控,针对现有监控技术存在的问题,本文基于图像识别的原理,设计并实现了一种分布式自动化监控系统,及时发现网站打开失败或错误、网站域名被劫持、网站内容被篡改等问题,并通过分布式的架构设计,有效避
2、免了单点监控时存在的系统稳定性差、告警误报率高等问题。关键词:内容安全;图像识别;分布式;自动化监控中图分类号:TP399文献标识码:A文章编号:1009-3044(2023)04-0086-03开放科学(资源服务)标识码(OSID):1 引言计算机网络技术的发展为人类信息与科技的传播提供了前所未有的方便与速度,然而飞速发展的技术是一把双刃剑,也为网上各类不良信息的传播、滋生内容安全隐患的温床创造了条件。内容安全包括两个方面1-3,第一个方面是对网页内容的保护,例如防范对网站内容的篡改,第二个方面是指网页内容需要符合各类政治、法律、道德等方面的要求。特别是防止网站中出现色情、赌博、恐暴、反动及
3、垃圾广告等影响国家安全、社会民生、个人生活的风险内容。仅2020年上半年,国家计算机网络应急技术处理协调中心通过监测发现我国境内出现篡改现象的网站数量已达147682个,监控网站内容、肃清互联网环境、保障内容安全是我们刻不容缓的艰巨任务。大量中小网站因为架构单薄、不具备有效的安全防护措施或维护人员技术水平有限等,频繁出现网站内容失效或被改动等质量问题,存在容易被篡改及遭受黑客攻击等安全隐患。对于这一类中小网站,传统的人工监控手段无法及时发现这些质量问题及安全隐患,使其更容易成为黑客攻击的重要目标。因此高效准确的网站自动化监控系统,是确保中小网站内容安全的“必备良药”。2 常用自动化网站监控手段
4、介绍自动化网站监控常用爬虫技术或接口技术来实现4-5,爬虫技术是对需要监控的网站,针对性地根据网站特点编写 Python 爬虫程序或使用现有爬虫工具,获取网站数据并进行网站对比,进行网站内容监控,监控网站是否存在无法打开或发生篡改的现象。这种方法节省时间、维护成本低、抓取的数据量远超手动收集的数据量。但是这种方法也存在一些问题,比如抓取工具较为依赖于外部网站,无法控制该网站何时更改其结构或内容,因此需要在抓取工具过时,重新进行抓取,更新维护工作量较大;此外大量网站使用多种不同的方法(例如IP阻止)来阻止爬虫工具抓取其内容,所以有可能被阻止访问,从而造成无效监控或误报问题。另一种最常见的监控技术
5、是接口监控,这种监控的效率最高,而且最容易发现问题,但是接口的监控并不能准确地反应用户看到的前端页面状态,比如数据异常、空白页面、部分内容加载异常等,这些情况不能通过自动化获取接口数据来实现全方位监控,所以需要使用页面级别的图像化监控。3 分布式监控系统设计与实现本文旨在针对现有网站自动化监控技术存在的问题,基于图像识别的原理,设计一种面向网站内容安全的自动化监控系统,为了避免单点监控时存在的系统稳定性差、告警误报率高等问题,构建分布式架构的监控系统。3.1 系统整体设计系统设计的基本思路是,构建分布式系统,在多个分布式监控终端上部署监控任务,利用计算机视觉处理技术,运用图像识别的原理6,模拟
6、人工访问分发网站,获取网站内容并自动进行识别、对比和分析,实收稿日期:2022-03-31基金项目:2021年度安徽高校自然科学研究项目重点项目(KJ2021A1451);2021年度安徽省质量工程项目;2022年度安徽省高校科研编制计划项目重点项目(2022AH052077)作者简介:田柳(1987),女,安徽合肥人,安徽职业技术学院工程师,助教,硕士研究生,主要研究方向为智能网联技术。E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology电脑知识与技术Vol.19,N
7、o.4,February202386DOI:10.14004/ki.ckt.2023.0186网络通信与安全本栏目责任编辑:代影Computer Knowledge and Technology电脑知识与技术第19卷第4期(2023年2月)第19卷第4期(2023年2月)时监测网站能否打开,内容有无异常,并将结果汇总到分布式系统的主监控终端上,进行综合判断,可以在问题发生的第一时间内,及时发现网站无法登录、网站被恶意篡改现象,及时推送告警,基于多个监控终端结果,从而排除偶发性网站打开失败或错误、监控终端或监控程序本身的问题,使得结果更准确。3.2 系统功能实现3.2.1 构建分布式监控系统构建
8、分布式监控系统,采用一个主监控终端及多个分布式监控终端的模式。其中,主监控终端负责对网站资源访问及监控任务进行调度并触发任务执行,向分布式监控终端部署采集任务,并分配给多个监控线程;启动监控线程后,分布式监控终端从队列资源获取URL,根据监控任务指定的目标网站打开对应的页面,下载并获取页面数据,各分布式监控终端通过对获取的页面内容自动进行识别分析,实时监测网站是否能打开,内容有无异常。各分布式监控终端实时将监测结果发送至主监控终端,并定期进行监控任务同步,监控任务由主监控终端下发至各监控终端。当不同监控终端对某网站的监控结果不同时,需通过对多次测试结果的分析来排除偶发性网站无法打开或错误、监控
9、终端或监控程序本身的问题,以保证监控结果的准确性,避免误报告警。此外,在排除偶发性网站打开失败或错误、监控终端或监控程序本身的问题后,应考虑是否为部分区域发生恶意DNS劫持或用户请求非法重定向等问题。3.2.2 基于图像识别的原理进行网站内容监控本文所述的网站内容监控的基本功能是通过图形化编程工具Sikuli实现,它由MIT开发,以python为基础,通过搭建Java环境来运行,不需要写一行行代码,这使得程序员编写代码工作大大简化,可以直接使用截图替代代码。它使用该工具来实现最基本的监控功能,并以网站中的典型图标、图片及文字等为参照物,实时监测网站是否能打开,内容有无异常。在基本的网站打开和典
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 面向 网站 内容 安全 分布式 监控 系统 设计 实现 田柳
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。