基于电网分布式存储构建业务分析模型的探索和研究.pdf
《基于电网分布式存储构建业务分析模型的探索和研究.pdf》由会员分享,可在线阅读,更多相关《基于电网分布式存储构建业务分析模型的探索和研究.pdf(4页珍藏版)》请在咨信网上搜索。
1、计算机与通信技术Computer and Communication Technology自动化技术与应用2024 年第 43 卷第 3 期Techniques ofAutomation&Applications基于电网分布式存储构建业务分析模型的探索和研究赵小凡,杜舒明,刘 超(广东电网有限责任公司广州供电局,广东 广州 510610)摘要:由于电网大数据分散存储在不同的独立存储服务中,难以保证文档检索全面性和准确性,影响查询业务质量。为此,构建基于电网分布式存储的业务分析模型。切分待存储文件,组成文件碎片,分布存储到不同的存储节点中,构建电网分布式存储模型。针对该模型,扩展查询业务关键词,
2、增大查询范围。基于查询业务扩展结果,构建业务探索分析模型,从分布式数据库中检索相关文档。实验结果表明:所构建模型的各类电网大数据检索F1值接近1,提高了电网分布式存储文档检索的全面性和准确性。关键词:电网分布式存储;扩展查询;检索模型;业务分析模型中图分类号:TP311.133.1文献标识码:A文章编号:1003-7241(2024)03-0124-04Exploration and Research on Constructing Service Analysis ModelBased on Power Grid Distributed StorageZHAO Xiao-fan,DU Shu
3、-ming,LIU Chao(Guangzhou Power Supply Bureau,Guangdong Power Grid Co.,Ltd.,Guangzhou 510610 China)Abstract:Because the big data of power grid is stored in different independent storage services,it is difficult to ensure the comprehensive-ness and accuracy of document retrieval,which affects the qual
4、ity of query business.In order to solve the above problems,a ser-vice analysis model based on power grid distributed storage is constructed.The files to be stored are segmented to form file frag-ments,distributed and stored in different storage nodes,and the power grid distributed storage model is c
5、onstructed.For this mod-el,it expands the query business keywords and expands the query scope.Based on the query business expansion results,it buildsa business exploration and analysis model to retrieve relevant documents from the distributed database.The experimental resultsshow that the F1 value o
6、f all kinds of power grid big data retrieval of the constructed model is close to 1,which improves thecomprehensiveness and accuracy of power grid distributed storage document retrieval.Keywords:power grid distributed storage;extended query;retrieval model;business analysis model收稿日期:2022-02-21DOI:1
7、0.20033/j.1003-7241.(2024)03-0124-04.1引言电力作为现代主要能源,在人们的生产、生活中起到了不可替代的作用。随着电网的大范围覆盖,电力大数据剧增,为电力服务提供了可靠的数据支持,但是电力数据的剧增给电力数据存储管理带来了巨大的难度和挑战,集中式存储已经无法满足电力管理要求,因此为减少电力存储压力,一种新式存储方式出现并被广泛应用,即分布式存储1。分布式存储就是将电网数据资源分散存储在多台独立服务器上,防止负载集中在一台服务器,使压力得以分散2。然而,随着需要存储的数据逐渐增加,更多独立服务器加入存储系统当中,造成业务查询困难。当用户需要进行查询时,输入查询指
8、令,数据库系统根据查询指令检索电网信息或数据文件。由于电网数据文件是分开存储的,导致查询出来的文件缺乏全面性。在此背景下,针对电网分布式存储模式,如何提高业务查询全面性成为提升电网数据服务质量的关键。针对上述问题,目前常用的解决方式是模糊查询方式,这种方式是利用模糊数学的贴近度进行信息查询的处理方法,由于拓宽了信息查询的应用范围,在不完整语义或歧义描述下也可获得较为完整的查询结果,但是这种方式容易查询出大量不相关或相关程度较低的电网信息,影响了查询精确度3。针对上述问题,提出一种基于电网分布式存储构建业务分析模型。通过该模型以期提高电网分布式存储业务调取的全面性和准确性,降低分布式存储的查询难
9、度,提高数据利用率和服务质量。2基于电网分布式存储的业务分析模型构建分布式存储模式的应用极大地缓解了电网大数据存储的压力,但是也增加数据查询的难度,很难保证数据查询的全面性。为此,针对电网分布式存储构建一种业务124自动化技术与应用2024 年第 43 卷第 3 期计算机与通信技术Computer and Communication TechnologyTechniques ofAutomation&Applications分析模型。该模型将查询扩展应用其中,通过查询词的扩展扩大查询业务范围,对扩展后的用户查询业务进行分析,完成从数据库中检索文件的任务4。2.1电网分布式存储模型目前,电网大数
10、据存储方式主要有两种,一种是集中式存储,一种是分布式存储。前者优点是部署结构简单,易于管理和查询,缺点是存储空间有限,对大数据的管理能力较差;后者与前者正好相反,优点是更能满足大数据存储的需要,存储空间较大,缺点是数据不易管理,查询访问难度大5。分布式存储是将大数据分散存储到若干个独立的存储服务上,不再是统一存储在一个存储节点上,极大地缓解了存储压力6,图1为分布式存储模型。图1分布式存储模型从图1中可以看出,分布式存储主要分为六步骤。下面针对这些步骤进行具体分析。步骤一:文件切分。分布式存储的前提和基础是对电网大数据X进行切分,切分成n个文件块,这些文件块也被称为文件碎片,构成集合,记为:(
11、1)式中,xi代表第i个文件碎片;步骤二:构建碎片矩阵。对文件碎片进行复制m次,得到碎片副本Xij。(2)式中,n代表文件碎片的副本数目;步骤三:构建文件碎片树Merkle Tree。将文件碎片随机存储到各个不同的存储节点上,构建文件碎片树7;步骤四:文件分发。文件碎片树结构将文件分发到不同的存储节点上,也就是建立文件碎片与存储节点之间映射关系,映射关系描述公式D(xij)如下:(3)其中,(4)(5)式中,ij代表碎片分发信息描述;i,j均代表碎片序号;MT(X)代表文件碎片树结构;p代表存储节点个数;r(ij,p)为随机选取函数;Y代表存储节点集合;f()代表选取规则;yr(ij,p)代表
12、存储节点8;步骤五:构建文件存储关系对应表ST(X)。(6)步骤六:构建分布式存储节点的文件标识信息F(X)。(7)式中,K(X)代表文件X的描述关键字集合。基于上述过程,完成了电网大数据的分布式存储,并给每个独立存储节点赋予了文件标识信息,以便后期文件查询的需要9。2.2查询业务扩展针对建立的电网分布式存储模型,为其查询业务建立扩展模型,也就是通过扩展检索词的辐射范围来解决分布式存储查询难以保证全面性的问题10。查询扩展,简单地说,就是查询语句扩展、字词的扩展等,通过一种基于聚类分析方法提出查询业务扩展方法。该方法基本原理如下:根据用户初始查询词得出查询结果,然后利用聚类算法对查询结果均需聚
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 电网 分布式 存储 构建 业务 分析 模型 探索 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。