数据中心专项方案设计V.doc
《数据中心专项方案设计V.doc》由会员分享,可在线阅读,更多相关《数据中心专项方案设计V.doc(20页珍藏版)》请在咨信网上搜索。
1、数据中心方案设计Bychja、系统拓扑图 b、4.5.1 设计目标建立一个集中分散、异构、可扩充、可集成、有统一数据模型、有多个角度视图、可交换和安全可靠复合数据库系统。它将成为政府多种业务系统、政府部门之间协同工作数据中心,是政府门户信息中心,多媒体、文档资料和政策法规存放中心和估计决议所需数据仓库中心。4.5.2 数据中心设计基础4.5.2.1 现实状况分析对于一个完整电子政务系统来说,统一框架和对应数据模式是十分关键。电子政务构建,正经历着由以技术为中心向以数据为中心方向转变,没有数据也就没有信息,也就没有政府网站及电子政府。数据中心在电子政务系统中处于中心地位,含有公共数据(信息)库、
2、模型库、文件交换站和公布信息政府门户网站功效,各数据源将自己数据上传给数据中心,而各部门依据自己需要从数据中心获取数据,实施自己应用。按信息应用属性,可将电子政务数据类型分为空间数据、基础数据、政务数据、专题数据和多媒体语音数据。整合政务信息资源,建设和改造政务数据库,并建立人口、法人机构、空间地理和自然资源、和宏观经济四个基础数据库,将成为中国以后数年电子政务建设关键。因为中国政府各部门对信息化建设深远意义认识不够,和政务建设有一个发展过程,造成了政府各部门、城市各行业信息化发展步调不一,从而使政务信息化建设存在部分问题:、信息共享、公开没有立发,信息采集、储存标准不统一,造成了互联互通不畅
3、,共享程度低。、信息共享机制还未建立,各职能部门内部信息相对封闭,产生了信息孤岛效应,造成了信息资源巨大浪费。、大部分单位业务应用系统还未形成一个内部资源共享、有效运行整体,需要在电子政务设计建设过场中进行整合和改造。、网络建设各自为政,结构不合理,互连互通十分困难。、安全性存在隐患,人门还不放心在网上共享数据。基于以上问题,需要在法律、技术、设备、管理等多方面加以考虑。政府数据资源建设,将有利于打破各级政府和部门对信息垄断和封闭,能够有效整合政务信息资源,强化对信息资源不停开发、更新和维护;从长远来说,这项工作开展,将有利于推进政府信息资源对社会开放,使之发挥巨大社会效益和经济效益。 4.5
4、.2.2 资源分类数据中心是电子政务数据资源建设基础,它是各类信息采集、加工和整合平台。数据中心资源大致可分为三大类,一是元数据库、政务叙词表和分类体系和代码表,二是GIS平台,三是服务资源。 (1) 元数据库考虑到以后各职能部门信息联接和交换,电子政务元数据库必需严格定义并向全网开放,不然将造成以后机构间数据交换无法实现。具体内容请参见4.3.3和4.3.4节。(2) 政务叙词表 电子政务和电子商务一个显著不一样是前者是为专题所驱动,以后者是交易驱动。在专题驱动系统中,规范专题词(叙词)库是至关关键,因为它是库内资源组织、管理和库际资源交换基础。规范政务叙词表即是对全部入库资源进行科学标引、
5、描述和分类,经过叙词严格语义内涵和位属关联,建立全部资源在专题层映射关系,对各类信息产品和服务过程起到基准性、规范性、参考性、结构性和工具性支持作用,以实现全库资源有序化,并提升其可用性。 如Internet有因特网、互联网、网际网路等名称,仅以其中一个名称进行全文检索、关键词检索等并不能确保文件查全率。而严格定义叙词表会在这些表示间建立关联,同时还会给出相关同位词,如Internet同位词有Intranet(即内部网、企业网、内联网、内特网等),和Extranet(外部网、外联网、外特网)等,上位词有计算机网络、网络和无线互联网、移动互联网等下位词。 资源库中全部文件资源只有在标引并和叙词库
6、建立映射后,才能使用户在专题查询时能进退自如。政务资源叙词表大致由以下分词表组成:机关公文专题词表、宏观经济专题词表、行业专题词表、社会事业专题词表和科学和技术专题词表等。 (3)信息分类、代码和指标体系表 分类和代码对于库中信息组织管理和服务是极其关键,同时,伴随国际经济一体化进程加紧,和国际标准信息分类体系兼容问题也日益关键。这些分类代码体系包含到国民经济行业分类代码、联合国及各国海关协调制度(HS)分类和代码、北美工业标准分类代码(NAICS体系)、全国行政区划分类和代码(扩展到乡镇级)、全国工农业产品/商品分类代码、各主导行业信息分类和代码和文件格式及其结构描述规范代码等。 另外,多种
7、指标体系和格式化文件对于政府宏观管理和决议分析也是极其关键。这类数据常以表格形式出现,并在各级机关部门中流转生成,它们之间交换也以表格形式进行。所以,字段统一、代码统一、格式统一、定义统一表格是主管部门从事经济分析、数据再处理和决议支持前提。 (4)GIS平台 几乎全部经济、产业和社会信息全部和地理空间信息相关,多年来GIS已融入IT业主体,并成为各类数据综合可视化基础平台。和专业数据结合各类专题电子地图更是各地政府进行区域经济和社会发展计划、开展招商引资、比较当地和周围地域竞争优势不可缺乏工具。同时,政务数据库资源只有在和GIS整合后,才能产生质变,真正为政府宏观调控起到决议支持作用。(5)
8、服务资源电子政务系统服务对象有4类:政府机构、公务员、公民、企业单位。服务资源即指直接为这4类用户提供服务信息。其中包含政府系统办公数据、各类业务数据、国家政策指令,多种政务图像、视频,还包含电子商务、工商、税务、金融、海关、法律、卫生、医疗、教育、职业等基础设施服务信息。4.5.2.3 数据特征(1)静态数据和动态数据电子政务数据中心必需满足电子政务平台进行数据交换需要,同时还必需满足在平台上建立各业务系统进行综合业务处理要求,并为门户系统提供多种静态和动态数据、信息。所谓静态信息是指对电子政务运行中不常常改变,供各个业务系统查询、处理数据或信息:政策、法规、元数据、资料库、多种多媒体数据等
9、,它们会伴随时间而逐步增大。所谓动态数据是指伴随运行而增加、修改数据:并联审批汉字件流转状态数据,反应企业、个人所处状态数据,国民经济运行状态数据等。动态数据同各个局委办信息亲密相关,但又是面向专题,如社会保险这个专题,实际上同保险、工资、税务和银行亲密相关;个人信用使用专题,它数据和银行、税务、个人消费、个人收入亲密相关。(2)微观应用和宏观应用数据共享政府业务中信息应用有微观应用和宏观应用之分,微观数据应用关键是针对个案事务处理。比如工商登记,业务申报,税务处理,个人劳保、补助、婚丧、驾照、护照、医疗等等。微观事务处理业务既包含对社会市场秩序监管,又包含对企业、对公众服务。这类事务处理工作
10、关键是由基层一线人员来负担,其信息共享特点是:由来自不一样方面信息要围绕一个主体来整合起来,比如将医疗卫生、计划生育、社会保障等信息依据人身份证号码整合起来,这就组成了以人为专题数据库。一样还能够建立以法人为专题数据库来整正当人信息咨询。实际上,微观信息共享关键是将不一样起源数据资源,整合为专题数据库。微观数据搜集常常是由不一样主管部门来做,如公安、税务、卫生部门、社保部门、工商部门等。要让这些部门搜集数据依据专题(主体)整合起来并不是轻易,首先必需要处理这些部门主观上抵制,这是一个政务改革和利益处理问题。在技术上,要求有很标准化唯一主体编码,并要开放数据结构,这么才有利于可共享专题数据库诞生
11、。深入,我们应该尽可能经过一表式调查、登记,将尽可能多数据集中地经过一次调查来完成,从而能尽可能地节省成本。因为管理角度不一样,我们极难经过一个专题数据来集中全部共享数据,可能,我们还是需要多个系统来分别处理各自业务,不过,经过数据整合设计以后系统,肯定能够降低数据搜集总成本,并为微观业务提供更有效服务。宏观应用数据共享,关键是为领导层服务,期望经过共享数据资源来提升政府决议水平。然而怎样从纷繁庞杂数据中挖掘出有用信息进行估计分析,怎样愈加好地管理和决议呢?我们能够选择数据仓库(Data Warehouse)作为决议支持系统关键。数据仓库是支持管理决议过程、面向专题、集成、不可更新且随时间不停
12、改变数据集合。利用数据仓库,对源数据经过提取、转换、加载形成统一数据格式,再利用数据挖掘和OLAP分析工具为决议者提供所需信息。数据仓库使用者关键是机关单位、市委领导等决议相关人员,为她们提供在业务办公基础数据库基础上多种层次汇总数据,帮助她们进行多种决议支持。对于数据仓库概念我们能够从两个层次给予了解,首先,数据仓库用于支持决议,面向分析型数据处理,它不一样于现有业务型数据库;其次,数据仓库是对多个异构数据源有效集成,集成后根据专题进行了重组,并包含历史数据,而且存放在数据仓库中数据通常不再修改。数据仓库关键有三方面作用:首先,数据仓库提供了标准报表和图表功效,其中数据起源于不一样多个事务处
13、理系统,所以,数据仓库报表和图表是相关整个集成信息报表和图表;其次,数据仓库支持多维分析,多维分析是经过把一个实体多项关键属性定义为多个维度,使得用户能方便地汇总数据集,简化了数据分析处理逻辑,并能对不一样维度值数据进行比较,而维度则表示了对信息不一样了解角度。应用多维分析能够在一个查询中对不一样阶段数据进行纵向或横向比较,这在决议过程中很有用;第三,数据仓库是数据挖掘技术关键基础,数据挖掘技术要在已经有数据中识别数据模式,以帮助用户了解现有信息,并在已经有信息基础上,对未来情况作出估计。即使数据仓库也有面向专题定义,但这些专题是较长时间,含有战略定义专题。由以上分析可见,依据数据库操作性、数
14、据语义,应该把数据库分为三大类:通常意义数据库即关系数据库、文本数据库(DB);供综合业务系统和门户使用面向专题数据库(OSD);数据仓库,它是供内门户决议者使用数据库(DW)。DB数据关键分布在各局委办,数据中心只有少许;所以它是集中分布。面向专题操作数据库(OSD)是电子政务数据中心主体,它是DB按专题映射数据库;数据仓库建立在DB和OSD之上专题数据库。这三种数据库关系描述以下:面向专题操作数据库是数据库体系中间层,首先包含全局一致、细节、目前或靠近目前数据;其次它是面向专题,集成数据环境,且数据量小,供各个综合业务系统查询处理使用,关键用作辅助完成日常决议数据分析处理。所以这种数据库关
15、键特征是:l 系统功效表4-1设计目标 处理类型 关键功效 需求特征中层辅助决议和综合查询 日常管理和控制决议,事务处理和决议分析并存 联机事务处理联机分析 综合全局中层l 数据特征表4-2内容 起源 组织 稳定性 综合性 特征目前或靠近目前数据 政府系统内部 专题 较稳定许可更新 某一专题综合和具体数据 全域一致数据环境l 数据库关键用户该数据库是反应某一专题数据,其用户是政府工作人员和就某一专题进行综合查询人员。(3)集中分布式数据管理当我们微观数据规模很大时候,依靠集中数据处理会是很不方便,我们能够将数据库建设分散化,由当地来进行数据搜集、整理和数据库更新。然而,数据使用却不能是地域化,
16、数据查询是全国范围。这么,共享数据管理和共享数据使用范围就会不一致。为了处理这一问题,能够考虑使用标准目录数据库,统一结构目录数据库将允很多层次分布式建立自己子系统,而又能自然形成一个整体,以支持统一数据库查询,这对于建立大规模专题数据库体系是很有效。数据就近管理和联合统一使用不仅会大大提升数据共享范围,而且会有效地降低数据维护管理成本。(4)数据源异构性数据源异构性关键表现在两方面:s 系统异构,数据源所依靠应用系统、数据库管理系统乃至操作系统之间不一样组成了系统异构。s 模式异构,数据源在存放模式上不一样。通常存放模式包含关系模式、对象模式、对象关系模式和文档嵌套模式等多个,其中关系模式为
17、主流存放模式。需要注意是,即便是同一类存放模式,它们模式结构可能也存在着差异。比如Oracle所采取数据类型和SQLServer所采取数据类型并不是完全一致。4.5.2.4 数据整合和集成需求异构数据源数据整合和集成目标是为综合应用系统提供集成、统一、安全、快捷信息查询、数据挖掘和决议支持服务。为了满足这个需求条件,整合、集成后数据必需确保一定集成性、完整性、一致性和访问安全性。1、集成性多种原先孤立业务信息系统数据经过整合、集成后,应该达成查询一个综合信息无须再到各个业务系统进行分别查询和人工处理,只要在数据中心中就能够直接访问到,即整合、集成后数据是各异构业务数据有机集成和关联存放(整合、
18、发掘出各业务数据间内在关联关系),而不是简单、孤立堆放在一个数据库系统里。2.完整性包含数据完整性和约束完整性两方面。s 数据完整性是指完整提取数据本身,通常来说,这一点较轻易达成。s 约束完整性,约束是指数据和数据之间关联关系,是唯一表征数据间逻辑特征。确保约束完整性是良好数据公布和交换前提,能够方便数据处理过程,提升效率。3.一致性不一样业务信息资源之间存在着语义上区分。这些语义上不一样会引发多种不完整甚至错误信息产生,从简单名字语义冲突(不一样名字代表相同概念),到复杂结构语义冲突(不一样模型表示一样信息)。语义冲突会带来数据集成结果冗余,干扰数据处理、公布和交换。整合、集成后数据应该依
19、据一定数据转换模式和业务规则进行统一数据结构和字段语义编码转换。4.访问安全性因为数据库资源可能归属不一样单位,各业务数据系统有着各自用户权限管理模式,访问和安全管理很不方便,不能集中、统一管理。所以既要确保能访问异构数据源中数据,又要保障原有数据库权限不被侵犯,实现对原有数据源访问权限隔离和控制,就需要设计数据中心统一用户安全管理模式来处理此问题。值得注意是,多个数据源之间数据集成,并不是要将全部数据进行集成,那么怎样定义要集成范围,就组成了集成内容限定问题。针对异构数据源整合和集成需求,能够采取数据仓库技术和数据抽取工具来实现。另外,依据国务院17号文件精神,电子政务系统需要整合信息资源,
20、建立人口、法人单位、空间地理和自然资源、宏观经济四个基础数据库。为何选择这四个库而不选择别数据库呢?这是基于基础性、公益性、战略性考虑。因为这四个数据库对别数据库建设来说是一个公共产品,其它数据库需要经过它服务,在它基础上不停发展,而产业库能够由中介机构来做。4.5.2.5 数据元标准化很多信息描述、定义、获取、表示形式因为缺乏统一、严格标准,致使大量信息数据处于分散、部门全部和各自为政状态,造成数据信息资源浪费,不利于实现全社会数据共享。为了提升政务信息共享和集成份析,确保为政府管理决议和社会各阶层提供科学正确信息,迫切需要开发出一个统一、以标准数据元形式对政务信息表示方法,以支持政务信息共
21、享和交换。 数据元(Data Element)是表示概念一类数据,其特征可由支持信息交换一组数据元属性来表示。或说数据元是一组可识别和可定义数据基础单元。通常来说数据元由数据元名称、属性、表示三部分组成。 数据元是用一组属性描述其定义、标示、表示和许可值一个数据单元。 组成数据元规范基础属性分为标示类属性、定义类属性、关系类属性、表示类属性、管理类属性。当然还能够依据需要增加扩展属性。数据元属性应依据一个标准方法来注册和控制,方便数据元字典中数据元在信息交换中保持一致性,而且能够在不一样数据管理环境中进行数据元管理。数据元基础属性关键有以下几类: s 标示类,适适用于数据元标示属性。包含名称、
22、标示符、版本、注册机构、同义名称、相关环境。 s 定义类,描述数据元语义方面属性。包含定义。 s 关系类,描述数据元之间相互关联和(或)数据元和分类模式、数据元概念、对象、实体之间关联属性包含分类模式、关键字、相关数据参考、关系类型。 s 表示类,描述数据元表示方面属性包含表示类别、表示形式、数据元值数据类型、数据元值最大长度、数据元值最小长度、表示格式、数据元许可值。 s 管理类,描述数据元管理和控制方面属性包含主管机构、注册状态、提交机构、备注。 在这些基础属性中名称、定义、表示类别、表示形式、数据元值数据类型、数据元值最大长度、数据元值最小长度、数据元许可值是在描述数据元时是必选。 数据
23、元表示是在数据处理和信息交换过程中数据元所采取格式。如数据长度、数据类型等全部要给说明,数据元格式受数据元属性及应用环境限定。 数据元可分为通用数据元和应用数据元。通用数据元是独立于任何具体应用而存在数据元,其功效是为应用领域数据元设计也就是为应用数据元设计提供一部通用数据元字典。应用数据元是在特定领域内使用数据元集,比如在电子政务领域应用。从这个意义上来讲国家标准数据元及交换格式、信息交换、日期和时间表示法就应该是一部通用数据元字典。 所谓数据元标准化就是对数据元总则、定义、描述、分类、表示和注册等制订统一标准,并加以落实、实施过程。在大量繁杂政务信息中,哪些概念能够作为我们定义数据元基础,
24、数据元概念特征中哪一个能够继承下来作为派生通用数据元特征,通用数据元特征中又有哪些能够被应用数据元所继承。以上这些问题全部是数据元标准化过程所要处理。 伴随社会发展,信息在社会各个行业中作用不停提升,数据元标准也越来越引发各个行业重视。大家认识到只要对信息按共同约定规则进行统一组织、分类和表示,使用同一概念,并用相同表示,就能做到共识,不致产生歧义。这种简化概念表述,提升了数据正确性,有利于数据共享、交换。 各政务系统所要处理对象关键是数据,数据元标准所要起作用就是用一个统一标准来描述、定义、规范这些系统所要处理数据,为系统间数据共享、数据交换提供一个公用信息接口。这个公用信息接口基础是政府部
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 专项 方案设计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。