通信线路状态统计数据仓库与OLAP应用.docx
《通信线路状态统计数据仓库与OLAP应用.docx》由会员分享,可在线阅读,更多相关《通信线路状态统计数据仓库与OLAP应用.docx(10页珍藏版)》请在咨信网上搜索。
1、通信线路状态统计数据仓库与OLAP应用1OLAP数据仓库总体设计数据仓库是一个面向主题的、集成的、非易失的,随时间变化的数据集合、支持管理部门的决策过程1。为了满足企业的需求,首先要对关系型数据和其它外部数据源进行抽取、转换、清洗,然后将处理过的数据装载到数据仓库中。联机分析处理从数据仓库中提取数据并建立多维数据集,使得用户可以利用多维数据集多角度、多层次地观察数据仓库中的数据,从而选取有价值的信息。线路状态统计系统的OLAP数据仓库总体结构如图1所示。图1数据仓库总体结构图通信源数据。源数据主要包括了通信运营企业的各种业务数据、外部数据以及与之相关规定的文档资料等。数据仓库服务器。通信源数据
2、通过ETL工具的数据清洗、转换等操作后,把历史数据集成到数据仓库中。其中,还包含数据仓库监控管理和数据仓库的元数据管理。OLAP及数据挖掘。数据仓库搭建好之后,在其基础之上建立多维数据集和进行数据挖掘工作。2通信线路状态统计数据仓库的建立21通信线路状态统计系统数据分析近年来,通信行业的快速发展,累积了大量的业务数据,这些数据包含了大量与企业发展相关的信息。通过对通信线路状态统计系统数据库系统的研究,得到与之相关的主要源数据表有32个,如端口统计表、测试统计表、每小时统计表等。22数据仓库主题的确定数据仓库中的数据是面向主题组织的。主题是在较高层次上将企业信息系统中的数据进行综合、归类和分析利
3、用的一个抽象概念,每一个主题基本对应一个宏观的分析领域2。针对需求分析,根据得到的分析型业务需求,结合应用系统及其数据的调研与数据分析的结果,按照通信公司数据库的特点,通信线路状态统计系统的主题可以分为端口统计主题、小时类统计主题、测试类统计主题。23设计数据仓库逻辑模型和物理模型目前,最流行的数据仓库数据模型是多维模型3。多维模型大多以星型模式、雪花型模式或事实星座模式的形式存在。本文采用雪花型模式。雪花型模式虽不如星型模式流行,但雪花型模式减少了数据的冗余。在数据仓库的逻辑结构中,数据表可以划分为两类:一类是事实数据表,用来存储数据仓库的实际数据,如通信线路状态统计的端口统计表即是一个事实
4、表;另一类是维度数据表,用来存储数据仓库的维度数据,如端口数目表、端口类别表、日期表、设备表等分析角度均为维度表等。事实表是数据仓库的核心,也是数据仓库中最大的表。事实表包含了通信线路状态统计的基本情况等详细信息,是对通信线路状态统计进行分析的素材。事实表的设计包括对事实的选择、量度的构造、粒度的设计和聚合的设计等。在本数据仓库设计中,共有3个事实表:端口统计事实表、测试统计事实表、每小时统计事实表。维度表是商务智能的基本驱动力。通过维的切换,可以从不同的角度观察客观世界。基于不同的维度,可以看到各量度的汇总情况,也可以同时从多个不同的维度进行交叉分析。该数据仓库设计中,主要有29个维度表。如
5、时间表、日期表、设备表、端口表等。在确定了数据仓库逻辑模型的事实表和维度表后,就要确定物理模型。数据仓库的物理模型就是数据仓库逻辑模型在物理系统中的实现模式,包括了逻辑模型中各种实体表的具体化,例如表的数据结构类型、索引策略、数据存放位置和数据存储分配以及物理模型的优化操作等4。完成数据仓库的逻辑模型和物理模型的设计后,就可以创建数据仓库。数据仓库也是一种数据库,因此在逻辑结构设计完成之后可以跟普通的数据库一样创建、修改和删除。24数据抽取、转换和加载完成数据仓库的设计后,就需要通过ETL工具往数据仓库中装载数据。ETL,即数据抽取、转换、装载的过程,是负责完成数据从源数据向目标数据仓库转化的
6、过程,是实施数据仓库的重要步骤,是构建数据仓库的重要一环5。用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中。目前,通信业务数据量越来越大,并且分布散乱、存储形式多样化,而原有的系统都是各公司根据自己的需求建立的小型系统,统计的标准多样化,数据的存储形式也不统一。如数据源可以是Oracle数据库、关系型数据库、纯文本数据、XML文件等,这就给编码增加了难度。因此首先要搜集通信企业各分公司的数据,然后将分公司的数据从Oracle数据库或Excel表格等数据源中抽取到企业数据库中,然后再进行ETL转换。首先对以前的数据代码进行统一规范,然后建立数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通信线路 状态 统计数据 仓库 OLAP 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。