数据仓库解决专项方案v要点.doc
《数据仓库解决专项方案v要点.doc》由会员分享,可在线阅读,更多相关《数据仓库解决专项方案v要点.doc(23页珍藏版)》请在咨信网上搜索。
1、数据仓库处理方案深圳太极云软技术股份1月目录(一)概述2一.中国信息化现实状况2二.以应用驱动,数据仓库建设应由后向前计划3三.“想大做小”(整体设计、分布实施)4(二)系统架构5数据仓库架构6系统功效架构7(三)数据仓库建设方法8数据仓库建设8大步骤91.系统分析,确定专题92.选择满足数据仓库系统要求软件平台103.建立数据仓库逻辑模型104.逻辑数据模型转化为数据仓库数据模型115.数据仓库数据模型优化126.数据清洗转换和传输137.开发数据仓库分析应用148.数据仓库管理15(四)系统功效具体介绍16企业数据门户16专题分析17即席查询18多维分析工具19ETL工具19报表工具21(
2、一) 概述一. 中国信息化现实状况1. 信息化建设发展历史:在中国信息化建设过程中,基础上是根据当初业务系统需求进行建设,过一段时间,假如有新业务推出,就再建设一个新系统,或在原系统基础上增加新业务处理。这么结果使每个系统和系统之间缺乏真正信息沟通和信息交换。2. 为何要建立数据仓库:依据现实状况业务系统各自为政,相互独立。当很多业务系统建立后,因为领导要求和决议需求,需要部分指标分析,在对应业务系统基础上再增加分析和对应报表功效,这么每个系统就增加了报表和分析功效。不过,因为数据源不统一造成了对同一个指标分析结果不相同。为了处理该问题,为了分析和决议需要,将相互分离业务系统数据源整合在一起,
3、能够为领导和决议层提供分析和辅助决议。二. 以应用驱动,数据仓库建设应由后向前计划数据仓库到底应该怎么建设?我一贯主张是应用驱动。什么样应用呢?应用是应考虑政府管理现实状况和决议层最关心问题入手。分利用现有信息系统资源,深入细化、量化权力清单,固化权力运行步骤和办理步骤,达成规范业务步骤、监督个体行为、统计执法诚信、科学考评评价和提升管理精度,最终使群众正当权益得到保护,实现权力有效监督和提升政府效能。经过分析经济发展、卫生健康、教育科技、道路交通、机构团体、生活服务、文体娱乐、安全避险、资源环境、社保就业、财税金融、法律服务等这些专题分析是否可行,应该优异行评定。这么从应用专题入手,就能够知
4、道需要什么样数据,来自那些业务系统和数据源,这些数据全体进行一定整合,根据分析要求存放就组成了一个个数据集市(Data Mart)。三. “想大做小”(整体设计、分布实施)为了避免原有业务系统相对独立而形成一个个信息孤岛,以应用驱动建设数据仓库,往往会造成新信息孤岛。这是因为应用往往是部门级或是某首先应用,不能完全覆盖企业级全部应用。当然我们这里不提倡一次建设应用。怎样避免这个问题,是我这里着关键要强调。这里分两种情形进行设计,系统作用1. 整合业务数据 在各业务系统中,数据不流通,形成信息孤岛,商业智能处理方案建立统一数据仓库,整合业务数据,给管理者提供统一视图,统一决议界面。 2. 支撑决
5、议 从数据中分析企业发展趋势,挖掘新机会方法,依据数据决议,提升决议立即性及正确率。 3. 提供管理效能,量化办事效率 基于系统分析内容,管理者能了解细化、量化权力清单,固化权力运行步骤和办理步骤,达成规范业务步骤、监督个体行为、统计执法诚信、科学考评评价和提升管理精度,最终使群众正当权益得到保护,实现权力有效监督和提升政府效能。(二) 系统架构系统架构图在建立数据仓库,数据仓库按专题域存放各业务数据。数据起源关键是政府管理结构不一样业务管理系统。经过数据交换平台定时采集各管理机构业务数据,后台数据处理工具ETL抽取、清洗数据,并加载入数据仓库中。架构于数据仓库上系统功效关键包含大数据门户、专
6、题专题分析、即系查询、多维分析、自助报表功效模块,经过这些功效模块为管理者获取数据和分析数据提供简单易用、功效强大方法,为管理者决议及提升管理精度,最终实现权力有效监督和提升政府效能。数据仓库架构数据仓库是一个建设过程,而不是产品。数据仓库是经过对来自不一样数据源进行统一处理及管理,经过灵活展示方法来帮助决议支持。 数据获取层实现怎样从全部源系统中取得原始业务数据,并对其进行一定数据处理,按专题进行数据重组和格式转换,然后传送并装载到数据仓库系统中。数据仓库系统需要从多个源数据系统中抽取和汇总各个业务数据,这些数据源系统是数据仓库系统数据起源。把上述数据源系统中数据根据专题进行划分和组织,然后
7、抽取并装载到数据仓库系统中。数据需要经过三个过程:数据抽取、数据转换、数据装载。这三个过程是在确保各个数据源系统和数据仓库系统能够成功连接(包含网络协议标准转换、不一样平台之间接口)前提下实现。确保把来自不一样源数据系统同类数据一致性和完整性,转换完成数据装载到数据仓库系统中。 数据管理层 把数据存放到企业级数据仓库系统中进行集中管理。在数据存放层,数据是存放在两类数据库中:关系型数据库和多维数据库。数据存放是数据仓库系统中心。取自多个数据源系统明细数据,和用于分析集成汇总数据全部存放在这个中心。它在逻辑上是一个完整库。 数据使用层 把数据仓库系统中数据和分析结果提供给最终用户。根据用户分析需
8、求、使用报表、随即查询、多维度分析和数据挖掘进行数据展现。数据输出层功效是使最终用户经过报表、图形和其它分析工具方法简便、快捷地访问数据仓库系统中多种数据,得到分析结果。 提供多个数据分析方法,包含标准报表、即席查询报表、动态分析报表、多维分析、趋势估计、假设分析和数据挖掘等。系统功效架构多维分析OLDP多角度、立体化、灵活动态分析业务数据。产品简单易用,无需编写任何代码,用户只需要经过语义层定义就能够轻松搭建自己多维数据模型。即席查询统计报表、指标快速检索,帮助业务分析人员快速取得所需要数据和统计信息。数据门户Data Portal进行统一展现,展现方法包含仪表盘、表格、报表、日历等内容,并
9、支持用户个性化定制内容、指标等功效,实现真正个性化服务。数据门户中展现内容是管理者及业务人员最关注指标,经过门户为她们获取数据提供最简单轻易方法。专题分析依据资源组织,支持数据深入挖掘和分析应用,跟踪、监控政策实施情况及实施效果,让管理层了解细化、量化权力清单,固化权力运行步骤和办理步骤,达成规范业务步骤、监督个体行为、统计执法诚信、科学考评评价和提升管理精度,最终使群众正当权益得到保护,实现权力有效监督和提升政府效能。报表业商业智能系统建设关键组成部分,关键对企业数据仓库中整合各专题域业务数据,根据监督管理要求,面向各级部门,快速提供正确、全方面、灵活表现政府管理效能等方面实际数据信息,为决
10、议支持、业务管理提供有效数据信息支撑。ETL工具:ETL是数据仓库最关键后台组件,经过对及汇总来不一样起源数据抽取、清洗、加载实现数据仓库中数据更新及流转。ETL工具(桥接器),实现了图形化及自动化方法来配置ETL步骤,极大减轻了数据加工工作量,提升了数据正确性及处理效率。(三) 数据仓库建设方法数据仓库决议分析业务处理步骤关键分为四个阶段。1) 数据集中:各级政府部门业务数据统一汇总数据中心临时数据存放;2) 数据整理和转换:汇总后业务数据经过ETL抽取、转换、加载到数据仓库中;3) 数据存放和管理:对数据仓库数据进行集中存放和管理、备份和维护;4) 数据挖掘和展现:用户经过前端展现工具对数
11、据仓库中数据进行挖掘、钻取和分析,在数据门户展现;各委办局业务系统人社公安民政交换平台政府数据中心临时存放数据抽取转换加载数据仓库数据集市决议趋势数据门户数据仓库建设8大步骤1.系统分析,确定专题确定一下多个原因:操作出现频率,即业务部门每隔多长时间做一次查询分析。在系统中需要保留多久数据,是十二个月、两年还是五年、十年。用户查询数据关键方法,如在时间维度上是根据自然年,还是财政年。用户所能接收响应时间是多长、是几秒钟,还是几小时。2.选择满足数据仓库系统要求软件平台选择适宜软件平台,包含数据库、建模工具、分析工具等。有很多原因要考虑,如系统对数据量、响应时间、分析功效要求等,以下是部分公认选
12、择标准:厂商背景和支持能力,能否提供全方位技术支持和咨询服务。数据库对大数据量(TB级)支持能力。数据库是否支持并行操作。能否提供数据仓库建模工具,是否支持对元数据管理。能否提供支持大数据量数据加载、转换、传输工具(ETT)。能否提供完整决议支持工具集,满足数据仓库中各类用户需要。3.建立数据仓库逻辑模型具体步骤以下:(1)确定建立数据仓库逻辑模型基础方法。(2)基于专题视图,把专题视图中数据定义转到逻辑数据模型中。(3)识别专题之间关系。(4)分解多对多关系。(5)用范式理论检验逻辑数据模型。(6)由用户审核逻辑数据模型。4.逻辑数据模型转化为数据仓库数据模型具体步骤以下:(1)删除非战略性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 解决 专项 方案 要点
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。