数据库设计三大范式

数据库设计范式

什么是范式:简言之就是,数据库设计对数据的存储性能,还有开发人员对数据的操作都有莫大的关系。所以建立科学的,规范的的数据库是需要满足一些

规范的来优化数据数据存储方式。在关系型数据库中这些规范就可以称为范式。

什么是三大范式:

第一范式:当关系模式R的所有属性都不能在分解为更基本的数据单位时,称R是满足第一范式的,简记为1NF。满足第一范式是关系模式规范化的最低要

求,否则,将有很多基本操作在这样的关系模式中实现不了。

第二范式:如果关系模式R满足第一范式,并且R得所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第二范式,简记为2NF。

第三范式:设R是一个满足第一范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第三范式,简记为3NF.

注:关系实质上是一张二维表,其中每一行是一个元组,每一列是一个属性

理解三大范式

第一范式

   1、每一列属性都是不可再分的属性值,确保每一列的原子性 

   2、两列的属性相近或相似或一样,尽量合并属性一样的列,确保不产生冗余数据。   

  

   

  如果需求知道那个省那个市并按其分类,那么显然第一个表格是不容易满足需求的,也不符合第一范式。 

   

   

  显然第一个表结构不但不能满足足够多物品的要求,还会在物品少时产生冗余。也是不符合第一范式的。

 第二范式 

  每一行的数据只能与其中一列相关,即一行数据只做一件事。只要数据列中出现数据重复,就要把表拆分开来。

   

   一个人同时订几个房间,就会出来一个订单号多条数据,这样子联系人都是重复的,就会造成数据冗余。我们应该把他拆开来。

   

   

   这样便实现啦一条数据做一件事,不掺杂复杂的关系逻辑。同时对表数据的更新维护也更易操作。

 第三范式

   数据不能存在传递关系,即没个属性都跟主键有直接关系而不是间接关系。像:a-->b-->c  属性之间含有这样的关系,是不符合第三范式的。

比如Student表(学号,姓名,年龄,性别,所在院校,院校地址,院校电话)

这样一个表结构,就存在上述关系。 学号--> 所在院校 --> (院校地址,院校电话)

这样的表结构,我们应该拆开来,如下。

(学号,姓名,年龄,性别,所在院校)--(所在院校,院校地址,院校电话)

最后:

三大范式只是一般设计数据库的基本理念,可以建立冗余较小、结构合理的数据库。如果有特殊情况,当然要特殊对待,数据库设计最重要的是看需求跟性能,需求>性能>表结构。所以不能一味的去追求范式建立数据库。

BC范式

关系模式R<U,F>∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。 

  解释一下:对于关系模式R,若 R中的所有非平凡的、完全的函数依赖的决定因素是码,则R属于BCNF。 

  若R∈BCNF 

  每一个决定属性集(因素)都包含(候选)码 

  R中的所有属性(主,非主属性)都完全函数依赖于码 

  R∈3NF(证明) 

  若R∈3NF 则 R不一定∈BCNF 

  在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 

  每一教师只教一门课。每门课由一名教师教,某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称 : (S,J)→T,(S,T)→J,T→J 

  由关系模式的定义可以得到如下结论,若R属于BCNF,则R有: 

  1.所有非主属性对每一个码都是完全函数依赖。 

  2.所有的主属性对每一个不包含它的码,也是完全函数依赖。 

  3.没有任何属性完全函数依赖于非码的任何一组属性。 

  由于R∈BCNF,按定义排除了任何属性对码的传递依赖与部分依赖,所以R∈3NF。但是若R∈3NF,则R未必属于BCNF。

1.第一范式:数据库的字段是单一属性,不可再分。
 解释:
  • 不能是复合属性,如果存在,应该拆分为多个属性
  • 不能是多值属性,如果存在,应该建立一个实体,而让此属性与其存在1对多的关系)
  • 不能是重复属性
2.第二范式:任何非关键字段不能部分依赖任一侯选关键字(即必须完全依赖)
 解释:
  • 表中必须存在侯选关键字,即每一行不同于其他任一行,是惟一区分的
  • 任何非关键字段不能依赖于侯选关键字的一部分
3.第三范式:任何非关键字段不能传递依赖任一侯选关键字
 解释:
  • 非关键字字段必须直接依赖任一侯选关键字
  • 非关键字段C不能依赖非侯选关键字B,因为样会形成传递依赖:侯选关键字A=>B=>C,因为这时的B往往是外键,即其他表的主键,也就是说表中不能含有其他表的非主属性
4.BC范式:任何字段都不能传递依赖任一侯选关键字
解释:
  • 与第三范式相比,一个是“任何非关键字段不能”,一个是“任何字段不能”,显然更严格了
  • 侯选关键字或其部分字段不能传递依赖其他的侯选关关键字
注释:
侯选关键字:又叫侯选码,惟一标识一行数据,其真子集不能是侯选关键字,一个表可以存在多个侯选关键字,如用户表的username,userid
主关键字:又叫主键,主码,被选中的用来区分其它行的侯选关键字,一个表只有一个主关键字
部分依赖:(A,B)->C,D,如A->C,则C部分依赖A
传递依赖:A->B->C,则C传递依赖A

注意点:

    1. 数据库连接会带来一部分的性能损失
    2. 并不是数据库范式越高越好
    3. 有时会在数据冗余与范式之间做出权衡,在实际的数据库开发过程中,往往会允许一部分的数据冗余来减少数据库连接。

参考1:http://www.cnblogs.com/knowledgesea/p/3667395.html

参考2:http://m.blog.csdn.net/blog/qq_20042935/42609609

原文地址:https://www.cnblogs.com/baoku/p/4829601.html