数据的三大范式以及什么是反三大范式

一:首先说一下什么是三大范式:

　　1.第一范式（1NF）：确保每一列的原子性（做到每列不可拆分）

　　2.第二范式（2NF）：在第一范式的基础上，非主字段必须依赖于主字段（一个表只做一件事）

　　3.第三范式（3NF）：在第二范式的基础上，消除传递依赖

　　上面都是官话 ,对于设计表来说第一范式是什么意思呢看表1-1

　　　　　　　　　　　　1-1

　　上面的用户表明显就不符合三大范式的第一范式:为什么呢?address字段列的数据中是"中国-北京";这是可以拆分的可以拆分成如下表,为什么要拆分呢,当我统计地区分类时,这样明显是不好统计,我们可以改成表1-2的形式,这就符合了第一范式的要求.

　　　　　　　　　　　　1-2

　　那什么又是第二范式,第二范式建立在第一范式的基础之上(在第一范式的基础上，非主字段必须依赖于主字段,一个表只做一件事),看表1-3

　　　　　　　　　　　 1-3

　　我们在后面又添加了数学成绩,英语成绩,家产等一系列的字段,如果这样设计的话,一张表可以满足一个项目所需要的所有字段,都合成在一张表中(后面无限加字段),这样就很乱了,也违背了第二范式

　　那什么又是第三范式,第三范式建立在第一范式的基础之上(消除传递依赖),看表1-4

　　　　　　　　　　 1-4

　　我们有一张订单表,里面有数量,单机,以及总价一些字段,但总价这个不应该有,总价是可以通过数量乘以单价得到,这就没有遵守第三范式(消除传递依赖)),如果没有理解清楚,我们再看表1-5与表1-6

　　　　　　　　　　　 1-5

　　　　　　　　　　　 1-6

　　在用户表中,正确来说我们用户表只该存一个企业id,企业名称这个字段是我们推导出来的,企业名称应该是去企业表中去查询,这就明显不符合第三范式;

一:再说什么是反三大范式:

　　说完三大范式,我们再说一下什么是反三范式,就拿第三范式来说,看表1-7

　　如果我们有数以万计的数据,每次查询完数据之后想要总价这个属性,我们就要进行数以万计次的计算,这明显会拖慢服务性能,就拿表1-5和1-6来说,我们每此查询用户的时候,回显企业信息的时候,还要去查询企业表,这样多了一次查询,也会拖慢服务器的性能.

　　总结来说呢:反三范式是基于第三范式所调整的，没有冗余的数据库未必是好的数据库，有时为了提高运行效率，就必须降低范式标准，适当保留冗余数据。基于业务的需要合理设计数据库

　　注释:博客中的部分数据来自于江苏传智播客.