高等教育关系数据理论与数据库设计一.pptx
《高等教育关系数据理论与数据库设计一.pptx》由会员分享,可在线阅读,更多相关《高等教育关系数据理论与数据库设计一.pptx(68页珍藏版)》请在咨信网上搜索。
1、1本章概要本章概要前面已经讲述了前面已经讲述了关系数据库关系数据库、关系模型关系模型的基本概念以的基本概念以及关系数据库的及关系数据库的标准语言标准语言。如何使用关系模型设计关系数据库,也就是面对一个如何使用关系模型设计关系数据库,也就是面对一个现实问题,如何选择一个比较好的关系模式的集合,现实问题,如何选择一个比较好的关系模式的集合,每个关系又应该由哪些属性组成。这属于数据库设计每个关系又应该由哪些属性组成。这属于数据库设计的问题,确切地讲是数据库的问题,确切地讲是数据库逻辑设计逻辑设计的问题的问题本章讲述本章讲述关系数据库规范化理论关系数据库规范化理论,这是数据库逻辑设,这是数据库逻辑设计
2、的理论依据。计的理论依据。要求了解规范化理论的研究动机及其在数据库设计中的作用掌握函数依赖的有关概念第一范式、第二范式、第三范式的定义重点掌握并能够灵活运用关系模式规范化的方法和关系模式分解的方法,这也是本章的难点。22.1 2.1 规范化问题的提出规范化问题的提出2.1.1 2.1.1 规范化理论的主要内容规范化理论的主要内容关关系系数数据据库库的的规规范范化化理理论论最最早早是是由由关关系系数数据据库库的创始人的创始人E.F.CoddE.F.Codd提出的提出的后后经经许许多多专专家家学学者者对对关关系系数数据据库库理理论论作作了了深深入入的的研研究究和和发发展展,形形成成了了一一整整套套
3、有有关关关关系系数数据据库库设计的理论设计的理论在在该该理理论论出出现现以以前前,层层次次和和网网状状数数据据库库的的设设计计只只是是遵遵循循其其模模型型本本身身固固有有的的原原则则,而而无无具具体体的的理理论论依依据据可可言言,因因而而带带有有盲盲目目性性,可可能能在在以以后后的运行和使用中发生许多预想不到的问题的运行和使用中发生许多预想不到的问题3在关系数据库系统中,在关系数据库系统中,关系模型关系模型包括一组包括一组关系关系模式模式,各个关系不是完全孤立的,数据库的设,各个关系不是完全孤立的,数据库的设计较层次和网状模型更为重要。计较层次和网状模型更为重要。如何设计一个适合的关系数据库系
4、统,关键是如何设计一个适合的关系数据库系统,关键是关系数据库关系数据库模式模式的设计,一个好的关系数据库的设计,一个好的关系数据库模式应该包括多少模式应该包括多少关系模式关系模式,而每一个关系模,而每一个关系模式又应该包括哪些式又应该包括哪些属性属性,又如何将这些相互关,又如何将这些相互关联的关系模式组建一个适合的联的关系模式组建一个适合的关系模型关系模型,这些,这些工作决定了到整个系统运行的效率,也是系统工作决定了到整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的成败的关键所在,所以必须在关系数据库的规规范化理论范化理论的指导下逐步完成。的指导下逐步完成。4关系数据库的规范
5、化理论主要包括三个方面的内容:关系数据库的规范化理论主要包括三个方面的内容:函数依赖范式(Normal Form)模式设计其其中中,函函数数依依赖赖起起着着核核心心的的作作用用,是是模模式式分分解解和和模模式式设计的基础,范式是模式分解的标准。设计的基础,范式是模式分解的标准。2.1.2 2.1.2 关系模式的存储异常问题关系模式的存储异常问题数据库的逻辑设计为什么要遵循一定的规范化理论?数据库的逻辑设计为什么要遵循一定的规范化理论?什么是好的关系模式?什么是好的关系模式?某些不好的关系模式可能导致哪些问题?某些不好的关系模式可能导致哪些问题?下面通过例子进行分析下面通过例子进行分析:5例如例
6、如,要求设计,要求设计教学管理数据库教学管理数据库,其关系模式,其关系模式SCDSCD如下:如下:SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)其其中中,SNOSNO表表示示学学生生学学号号,SNSN表表示示学学生生姓姓名名,AGEAGE表表示示学学生生年年龄龄,DEPTDEPT表表示示学学生生所所在在的的系系别别,MNMN表表示示系系主主任任姓名,姓名,CNOCNO表示课程号,表示课程号,SCORESCORE表示成绩。表示成绩。根据实际情况,这些数据有如下语义规定:根据实际情况,这些数据有如下语义规定:1.一个系有若干个学生,但一个学生只属于一个系;2.一个系只有一名系主
7、任,但一个系主任可以同时兼几个系的系主任;3.一个学生可以选修多门功课,每门课程可有若干学生选修;4.每个学生学习课程有一个成绩。在在此此关关系系模模式式中中填填入入一一部部分分具具体体的的数数据据,则则可可得得到到SCDSCD关关系系模模式式的的实实例例,即即一一个个教教学学管管理理数数据据库库,如如图图2.12.1所所示。示。6图图2.1 2.1 关系关系SCDSCDSNOSNAGEDEPTMNCNOSCORES1赵亦17计算机刘伟C190S1赵亦17计算机刘伟C285S2钱尔18信息王平C557S2钱尔18信息王平C680S2钱尔18信息王平C770S2钱尔18信息王平C570S3孙珊2
8、0信息王平C10S3孙珊20信息王平C270S3孙珊20信息王平C485S4李思男自动化刘伟C1937根根据据上上述述的的语语义义规规定定,并并分分析析以以上上关关系系中中的的数数据据,我我们们可可以以看看出出:(SNO,CNO)属属性性的的组组合合能能唯唯一一标标识识一一个个元元组组,所所以以(SNO,CNO)是是该该关关系系模模式式的的主主关关系系键键。但但在在进进行行数数据库的操作时,会出现以下几方面的问题。据库的操作时,会出现以下几方面的问题。1.1.数数据据冗冗余余。每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也都要重复存储多次,
9、数据的冗余度很大,浪费了存储空间2.2.插插入入异异常常。如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。因因为为在在这这个个关关系系模模式式中中,(SNO,CNO)是是主主关关系系键键。根根据据关关系系的的实实体体完完整整性性约约束束,主主关关系系键键的的值值不不能能为为空空,而而这这时时没没有有学学生生,SNOSNO和和CNOCNO均均无无值值,因因此此不不能能进进行行插插入操作。入操作。另另外外,当当某某个个学学生生尚尚未未选选课课,即即CNOCNO未未知知,实实体体完完整整性性约约束束还还规规定定,主主关关系系键键的的值值不不能能部部分分为为空空,同同样样不不
10、能进行插入操作。能进行插入操作。83.3.删除异常。删除异常。某某系系学学生生全全部部毕毕业业而而没没有有招招生生时时,删删除除全全部部学学生生的的记记录录则则系系名名、系系主主任任也也随随之之删删除除,而而这这个个系系依依然然存存在在,在数据库中却无法找到该系的信息。在数据库中却无法找到该系的信息。另另外外,如如果果某某个个学学生生不不再再选选修修C1C1课课程程,本本应应该该只只删删去去C1C1,但但C1C1是是主主关关系系键键的的一一部部分分,为为保保证证实实体体完完整整性性,必必须须将将整整个个元元组组一一起起删删掉掉,这这样样,有有关关该该学学生生的的其其它它信息也随之丢失。信息也随
11、之丢失。4.4.更新异常。更新异常。如如果果学学生生改改名名,则则该该学学生生的的所所有有记记录录都都要要逐逐一一修修改改SNSN又又如如某某系系更更换换系系主主任任,则则属属于于该该系系的的学学生生记记录录都都要要修修改改MNMN的的内内容容,稍稍有有不不慎慎,就就有有可可能能漏漏改改某某些些记记录录,这就会造成数据的不一致性,破坏了数据的完整性。这就会造成数据的不一致性,破坏了数据的完整性。9由由于于存存在在以以上上问问题题,我我们们说说,SCDSCD是是一一个个不不好好的的关关系系模模式式。产产生生上上述述问问题题的的原原因因,直直观观地地说说,是是因因为为关关系系中中“包罗万象包罗万象
12、”,内容太杂了。,内容太杂了。那么,怎样才能得到一个好的关系模式呢?那么,怎样才能得到一个好的关系模式呢?我我们们把把关关系系模模式式SCDSCD分分解解为为下下面面三三个个结结构构简简单单的的关关系系模模式,如图式,如图2.22.2所示。所示。学生关系S(SNO,SN,AGE,DEPT)选课关系SC(SNO,CNO,SCORE)系关系D(DEPT,MN)10S SCS SCS SCS SCSNOSNAGEDEPTSNOCNOSCORES1赵亦17计算机S1C190S2钱尔18信息S1C285S3孙珊20信息S2C557S4李思21自动化S2C680S2C7D D D DS2C570DEPTM
13、NS3C10计算机刘伟S3C270信息王平S3C485自动化刘伟S4C193图3.2 分解后的关系模式11在以上三个关系模式中,实现了信息的某种程在以上三个关系模式中,实现了信息的某种程度的分离,度的分离,S中存储学生基本信息,与所选课程及系主任无关D中存储系的有关信息,与学生无关SC中存储学生选课的信息,而与所学生及系的有关信息无关与与SCDSCD相比,分解为三个关系模式后,数据的相比,分解为三个关系模式后,数据的冗余度明显降低。冗余度明显降低。当新插入一个系时,只要在关系D中添加一条记录当某个学生尚未选课,只要在关系S中添加一条学生记录,而与选课关系无关,这就避免了插入异常当一个系的学生全
14、部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异常同时,由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。12经经过过上上述述分分析析,我我们们说说分分解解后后的的关关系系模模式式是是一一个好的关系数据库模式。个好的关系数据库模式。从从而而得得出出结结论论,一一个个好好的的关关系系模模式式应应该该具具备备以以下四个条件:下四个条件:1.尽可能少的数据冗余。2.没有插入异常。3.没有删除异常。4.没有更新异常。13但但要要注注意意,一一个个好好的的关关系系模模式式并并不不是是在在任任何何情情况下都是最优的况下都是最优的如何按照一定的规范设
15、计关系模式,将结构复如何按照一定的规范设计关系模式,将结构复杂的关系分解成结构简单的关系,从而把不好杂的关系分解成结构简单的关系,从而把不好的关系数据库模式转变为好的关系数据库模式,的关系数据库模式转变为好的关系数据库模式,这就是这就是关系的规范化,关系的规范化,规范化又可以根据不同规范化又可以根据不同的要求而分成若干级别的要求而分成若干级别我们要设计的关系模式中的各属性是相互依赖、我们要设计的关系模式中的各属性是相互依赖、相互制约的,这样才构成了一个结构严谨的整相互制约的,这样才构成了一个结构严谨的整体。因此在设计关系模式时,必须从语义上分体。因此在设计关系模式时,必须从语义上分析这些析这些
16、依赖关系依赖关系142.2 2.2 函数依赖函数依赖2.2.12.2.1函数依赖的定义及性质函数依赖的定义及性质关关系系模模式式中中的的各各属属性性之之间间相相互互依依赖赖、相相互互制制约约的的联联系系称为称为数据依赖数据依赖。数据依赖一般分为数据依赖一般分为函数依赖函数依赖、多值依赖多值依赖和和连接依赖连接依赖。其中其中,函数依赖函数依赖是最重要的数据依赖。是最重要的数据依赖。函函数数依依赖赖(Functional Functional DependencyDependency)是是关关系系模模式式中中属属性之间的一种性之间的一种逻辑依赖关系逻辑依赖关系。例如在上一节介绍的关系模式SCD中,
17、SNO与SN、AGE、DEPT之间都有一种依赖关系。由于一个SNO只对应一个学生,而一个学生只能属于一个系,所以当SNO的值确定之后,SN,AGE,DEPT的值也随之被唯一的确定了。这类似于变量之间的单值函数关系。设单值函数Y=F(X),自变量X的值可以决定一个唯一的函数值Y。在这里,我们说SNO决定函数(SN,AGE,DEPT),或者说(SN,AGE,DEPT)函数依赖于SNO。15下面给函数依赖的形式化定义。下面给函数依赖的形式化定义。2.2.1.12.2.1.1函数依赖的定义函数依赖的定义定定义义2.12.1设设关关系系模模式式R(UR(U,F)F),U U是是属属性性全全集集,F F是
18、是U U上上的的函函数数依依赖赖集集,X X和和Y Y是是U U的的子子集集,如如果果对对于于R(U)R(U)的的任任意意一一个个可可能能的的关关系系r r,对对于于X X的的每每一一个个具具体体值值,Y Y都都有有唯唯一一的的具具体体值值与与之之对对应应,则则称称X X函函数数决决定定Y Y,或或Y Y函函数数依依赖赖于于X X,记记作作XYXY。我我们们称称X X为为决决定定因因素素,Y Y为为依依赖赖因因素素。当当Y Y不不函函数数依依赖赖于于X X时时,记记作作:X X Y Y。当当XYXY且且YXYX时时,则则记记作作:X YX Y。对于关系模式对于关系模式SCDSCDU=SNO,S
19、N,AGE,DEPT,MN,CNO,SCOREF=SNOSN,SNOAGE,SNODEPT一一个个SNOSNO有有多多个个SCORESCORE的的值值与与其其对对应应,因因此此SCORESCORE不不能能唯唯一一地地确确定定,即即SCORESCORE不不能能函函数数依依赖赖于于SNOSNO,所所以以有有:SNO SCORESNO SCORE。但是但是SCORESCORE可以被(可以被(SNOSNO,CNOCNO)唯一地确定。所以可表)唯一地确定。所以可表示为:(示为:(SNOSNO,CNOCNO)SCORESCORE。16有关函数依赖的几点说明:有关函数依赖的几点说明:1 1平凡的函数依赖与非
20、平凡的函数依赖。平凡的函数依赖与非平凡的函数依赖。当属性集Y是属性集X的子集时,则必然存在着函数依赖XY,这种类型的函数依赖称为平凡的函数依赖。如果Y不是X的子集,则称XY为非平凡的函数依赖。若不特别声明,我们讨论的都是非平凡的函数依赖。2 2函数依赖是语义范畴的概念。函数依赖是语义范畴的概念。我们只能根据语义来确定一个函数依赖,而不能按照其形式化定义来证明一个函数依赖是否成立。例如,对于关系模式S,当学生不存在重名的情况下,可以得到:SNAGESNDEPT这种函数依赖关系,必须是在没有重名的学生条件下才成立的,否则就不存在函数依赖了。所以函数依赖反映了一种语义完整性约束。173 3函数依赖与
21、属性之间的联系类型有关。函数依赖与属性之间的联系类型有关。(1)在一个关系模式中,如果属性X与Y有1:1联系时,则存在函数依赖XY,YX,即X Y。例如,当学生无重名时,SNO SN。(2)如果属性X与Y有m:1的联系时,则只存在函数依赖XY。例 如,SNO与 AGE,DEPT之 间 均 为 m:1联 系,所 以 有SNOAGE,SNODEPT。(3)如果属性X与Y有m:n的联系时,则X与Y之间不存在任何函数依赖关系。例如,一个学生可以选修多门课程,一门课程又可以为多个学生选修,所以SNO与CNO之间不存在函数依赖关系。由于函数依赖与属性之间的联系类型有关,所以在确定由于函数依赖与属性之间的联
22、系类型有关,所以在确定属性间的函数依赖关系时,可以从分析属性间的函数依赖关系时,可以从分析属性间的联系类属性间的联系类型型入手,便可确定属性间的函数依赖。入手,便可确定属性间的函数依赖。184 4函数依赖关系的存在与时间无关。函数依赖关系的存在与时间无关。因为函数依赖是指关系中的所有元组应该满足的约束条件,而不是指关系中某个或某些元组所满足的约束条件。当关系中的元组增加、删除或更新后都不能破坏这种函数依赖。因此,必须根据语义来确定属性之间的函数依赖,而不能单凭某一时刻关系中的实际数据值来判断。例如,对于关系模式S,假设没有给出无重名的学生这种语义规定,则即使当前关系中没有重名的记录,也只能存在
23、函数依赖SNOSN,而不能存在函数依赖SNSNO,因为如果新增加一个重名的学生,函数依赖SNSNO必然不成立。所以函数依赖关系的存在与时间无关,而只与数据之间的语义规定有关。195 5函数依赖可以保证关系分解的无损连接性。函数依赖可以保证关系分解的无损连接性。设R(X,Y,Z),X,Y,Z为不相交的属性集合,如果XY或XZ,则有R(X,Y,Z)=RX,Y*RX,Z,其中,RX,Y表示关系R在属性(X,Y)上的投影,RX,Z表示关系R在属性(X,Z)上的投影。即R(X,Y,Z)等于其投影在X上的自然连接,这样便保证了关系R分解后不会丢失原有的信息,称作关系分解的无损连接性。例如,对于关系模式SC
24、D,有SNO(SN,AGE,DEPT,MN),SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)=SCDSNO,SN,AGE,DEPT,MN*SCDSNO,CNO,SCORE,也就是说,用其投影在SNO上的自然连接可复原关系模式SCD。202.2.1.2 2.2.1.2 函数依赖的基本性质函数依赖的基本性质1 1投影性。投影性。根据平凡的函数依赖的定义可知,一组属性函数决定它的所有子集例如,在关系SCD中,(SNO,CNO)SNO和(SNO,CNO)CNO。2 2扩张性。扩张性。若XY且WZ,则(X,W)(Y,Z)。例如,SNO(SN,AGE),DEPTMN,则有(SNO,DE
25、PT)(SN,AGE,MN)。213 3合并性。合并性。若XY且XZ则必有X(Y,Z)。例 如,在 关 系 SCD中,SNO(SN,AGE),SNO(DEPT,MN),则有SNO(SN,AGE,DEPT,MN)。4 4分解性。分解性。若X(Y,Z),则XY且XZ。很显然,分解性为合并性的逆过程由由合合并并性性和和分分解解性性,很很容容易易得得到到以以下下事事实:实:XA1,A2,,An成立的充分必要条件是XAi(i=1,2,n)成立。232.2.3 2.2.3 完全函数依赖与部分函数依赖完全函数依赖与部分函数依赖定定义义2.42.4 设设关关系系模模式式R(U)R(U),U U是是属属性性全全
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高等教育 关系 数据 理论 数据库 设计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。