![点击分享此内容可以赚币 分享](/master/images/share_but.png)
HIS系统财务数据库异常检测技术及应用.pdf
《HIS系统财务数据库异常检测技术及应用.pdf》由会员分享,可在线阅读,更多相关《HIS系统财务数据库异常检测技术及应用.pdf(3页珍藏版)》请在咨信网上搜索。
1、Microcomputer Applications Vol.39,No.8,2023文章编号:10 0 7-7 57 X(2023)08-0013-03摘要:当前,医院信息系统(HIS)已成为医院信息化建设的重要内容,但HIS与财务数据库的接入仍然采用传统的方式,导致财务重要数据存在一定的安全隐患。为了有效消除用户异常行为对医院财务数据库所构成的安全隐患,设计一种财务数据库异常检测技术。通过调取财务数据库运行日志中的用户查询内容及相应结果,采用k-means聚类算法进行用户分组,采用NavieBayes算法构建异常检测模型。应用测试结果表明,与传统的用户行为轮廊算法相比,所提出的算法准确率提
2、高了7.06个百分点,综合F1值提高了3.33个百分点,此外,在大幅度缩减计算量的基础上模型训练时间缩短了8 1%,极大地提高了财务数据的安全性。关键词:财务数据库;异常检测;NavieBayes算法;HIS;安全隐惠中图分类号:TP393.08(1.The Nuclear Industry General Hospital(The Second Affiliated Hospital of Soochow University),Suzhou 215000,China;2.The Suzhou Branch of Shanghai Pudong Development Bank,Suzhou
3、 215028,China)Abstract:Currently,hospital information system(HIS)has become an important part of hospital information construction.However,the access between HIS and financial database still adopts the traditional way,resulting in certain security risks.Inorder to effectively eliminate the security
4、risks posed by abnormal user behavior to hospital financial database,an anomaly de-tection technology is proposed and designed.By retrieving the user query contents and corresponding results in the operation ofthe financial database,the k-means clustering algorithm is used to group users,and Navie B
5、ayes algorithm is used to build an a-nomaly detection model.The application test results show that compared with the traditional user behavior contour algorithm,the accuracy of the proposed algorithm is improved by 7.06%,and the comprehensive Fi value is improved by 3.33%.In addi-tion,on the basis o
6、f greatly reducing the amount of calculation,the model training time is shortened by 81%,which greatlyimproves the security of financial data.Key words:financial database;anomaly detection;Navie Bayes algorithm;hospital information system(HIS);security risk0引言近年来,随着互联网用户的急剧增加,各种网络入侵事件层出不穷,入侵检测系统的研发随
7、之加快。异常检测作为人侵检测的一种技术已经成为相关研究的热点项目1。HIS系统中财务数据库安全关系到医院重要数据的安全,因此,针对财务数据库安全问题提出了一种数据库异常检测技术,通过以用户查询方式结构替代用户轮廓进行特征提取的方式对现有算法进行了优化,大幅度精简了计算量。采用k-means聚类算法进行用户分类,有效提高了算法的检测精度。基金项目:江苏省卫生计生财务研究课题(CW201710)作者简介:李晨(198 9一),女,硕士,研究方向为财务管理、会计;孙亮(198 0 一),男,本科,研究方向为医院管理信息化应用;邹元(198 5一),男,本科,研究方向为金融、财务分析。通信作者:张丽湘
8、(197 1一),女,本科,副总会计师,研究方向为财务管理。.13.基金项目HIS系统财务数据库异常检测技术及应用李晨,孙亮,邹元,张丽湘1*(1核工业总医院(苏州大学附属第二医院),江苏,苏州2 150 0 0;2.上海浦东发展银行苏州分行,江苏,苏州2 150 2 8)文献标志码:AAnomaly Detection Technology and Applicationof Financial Database in HIS SystemLI Chen,SUN Liang,ZOU Yuan?,ZHANG Lixiangl*1.1k-means 聚类算法假设存在一个包括n个对象的数据集D,通
9、过一定的方法将这些对象划分到k个不同的簇Ci,C 2,C 中,且在1i,jk时,有C,CD,C.nC,=g2。分类效果通过一个目标函数进行判断,使同一个簇内的所有对象具有高度相似性,同时又与其他簇内的对象具有明显的差异 3。基于簇的中心点形心的分类方法,以簇的形心c;对其所在的簇进行描述。数据集中的对象pEC,与形心ci之间的差异采用欧氏距离distd(p,c,)来表示。所使用的目标函数为mind(Y,c,)i=1,2,.,k微型电脑应用2 0 2 3年第39 卷第8 期1算法设计(1)Microcomputer Applications Vol.39,No.8,2023其中,Y代表数据集中的
10、对象,C代表簇C的形心。kmeans算法流程4如下:建立k个初始簇,从数据集D中随机选取k个对象作为每个初始簇的形心;计算簇内所有对象的均值并将每个对象都分配到与其相似性最高的簇中;重新计算各个新簇中所有对象的均值,直到所选取的目标函数开始收敛。k-means算法的不足之处是聚类的结果取决于初始化过程中聚类中心初始值的选取是否恰当。1.2NaiveBayes算法假设模型输入空间二R是一个n维向量的集合,输出空间是一个类的标记集合=(c 1,C2,C)。特征向量E作为模型的输入,对应的输出为类标记yE5。X、Y分别为输入空间和输出空间中的随机向量,2 个随机向量的联合概率分布为P(X,Y)。由P
11、(X,Y)以独立同分布的方式生成训练数据集T=(a i,y i),(a 2,y 2),(n,y))。Na-iveBayes算法在训练数据集的过程中对P(X,Y)进行机器学习,目标是获取先验概率和条件概率两种分布 6 。其中,先验概率分布的表达式为P(Y=c)i=1,2,k条件概率分布的表达式 7 为P(X=|Y=c,)=P(X(),.,X()=(Y=c)i-1,2,.,k通过式(3)学习到联合概率分布P(X,Y)。在NaiveBayes算法中,对条件概率分布做出了以下独立性假设:P(X=|=c)=IIP(XC)=()|Y=c)(4)Naive Bayes算法流程 7 将作为模型的输人,利用经过
12、学习的模型可计算得到后验概率分布P(Y=cIX=),拥有最大值的那个类即可认定为所属的类。依据贝叶斯定理可进行后验概率的计算:P(X=/Y=c;)P(Y=c;)P(Y=Ci I X=)=P(X=/Y=c,)P(Y=c,)i=1,2,k式(4)与式(5)相结合可得:P(Y=ci I X=)=P(Y=c.)II P(X)=2()Y=c.)P(Y=c)IIP(X)=2)/=c.)1式(6)即为Naive Bayes分类(NBC)的基本公式,由此可得到NaiveBayes分类器的表达式,如式(7):y=f()=arg maxP(Y=c;I X=)=P(Y=c.)IIP(XO)=2)IY=c.)ZP(Y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HIS 系统 财务 数据库 异常 检测 技术 应用
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。