2018/06/11 数据库设计规范

最近都没什么时间来写博客,工做太忙......

不过这也不是什么借口。

最近在学习相关知识,写下来记录一下吧。

注意:

    这里的规范并不是绝对的,如果你的团队已经制定了规范。
    请按照团队规范来实行。
    如果没有,请尽量遵循基本规范。并推动制定规范。

数据库设计规范:

  1:数据库名/表名 小写

    数据库等于是在 Liunx 上的一个个文件,Linux 是区分大小写的,所以表/库也是如此,为了避免在大小写上引起的错误,尽量使用小写来作为统一规定。

  2:不使用mysql关键字

    关于这个问题,老生常谈了吧,不使用 mysql 的关键字,也是为了避免错误。  

  3:  临时表命名规范

    在实际工作,不免要创建一些临时表进行工作,而且会有时忘记清理(很大可能).

    最后也忘记了那个是临时表,所以需要对临时表的命名做出规范,以便于我们知道那个是临时表。

    命名规范为:以tmp为前缀-日期为后缀

    例如:tmp_temporary_20180611

  3:  备份表命名规范

    同上

    命名规范为:bak为前缀_日期为后缀

    例如:例如:bak_temporary_20180611

  4:储存相同数据的列名和类类型必须一致

      

    这里有两张表,一个用户ID,一个文章,文章一个外键是user_id

    他们储存的是同种数据,所以在构建时,他们的数据类型等等必须都一致

    如果不一致,Mysql 其实是会在内部进行一个隐式的字符转换,会耗费性能。

   5:统一使用innodb

    在 mysql5.6 之后,默认引擎已经变为了 Innodb 。

    和 innodb 相比,Myisam 的优势已经很小了,而且在混用的时候,Myisam 的工作并不是那么理想。

    所以我们在没有特殊场景时候,应该默认使用 Innodb。

    它的优势在很多地方都有 支持行锁/实务/高并发下效果更好

  6:统一使用uft8

    字符集一直是一个比较容易被忽视的地方,实际在任何时候,字符集都是一个比较重要的地方。

    混乱的字符集会导致数据的丢失和无法恢复。

    于是需要统一字符集,统一使用uft8

  7:表和字符添加注释

    注释的意义,不用多言,同时数据表也是需要注释的。

    从最开始 对于数据字典的维护 是非常有必要的,可以使后面的同学快速明白字段的意义。

    也不会出现公司运转几年之后,拿出一张表,没有一个人能完整说出字段的意义这种窘境。

  8: 尽量控制单表数据量大小

    之前有人说,mysql的单表最大数是 500万。

    关于这个并不是一个准确数字,他和操作系统,位数,等等都有关系。

    不过太大,并不是个好事情,对于太大的表

      -- 进行历史数据归档

      -- 分库分表

  9:尽量冷热分离,减少列数

    尽量把冷热的数据区分开来,便于使用查询,提高读入效率。

    减少表的列数,并不是越多越好, 表列多,在读入时就会消耗更多的内存

    建议经常使用的列放入一个列。

 

  10: 禁止在表中预留字段

    在开发中,经常会有预留字段的事情发生,因为可能知道之后需要补充一些字段。

    这样感觉也没什么错,但是却造成了极大浪费

    一是由于预留字段无法见名知意,也会使用大字段VARCHAR()来进行存储。

    在之后修改字段的话也会进行数据库的锁表,导致一段时间的服务异常。

    怎么想都是不合算的,于是在开发时一定要避免这种事情的产生。

   11:禁止存文件/图片 等二进制数据

    太大,太长,你懂得

   12:禁止在线上做压力测试/禁止从开发环境_测试 直接连接数据库

    避免脏数据的产生,建议使用专门搭建的测试环境。    

索引规范

索引并不是越多越好。
大量的索引会使Mysql优化器在选择时耗费大量的时间。

  1: 限制每张表的索引数量

    最好不要超过五个,索引不是越多越好,会提高/也会降低索引

    禁止给每一列建立索引,并不會獲得很好的效果

  

  2:在哪些列上建立索引?

    在 select/update/delete SQL中的 where 条件中建立索引

    在 order by / group by 字段上建立索引

  3:如何选择索引列顺序(待研究)

    区分度最高的列放在联合索引的最左侧

    字段长度小的放在联合索引的最左侧

    最频繁查询的字段放在联合索引的最左侧

  

  4:尽量少使用外键

    不建议使用外键约束,在使用外键约束时,会影响 父/子 的写性能。

    推荐使用索引

  

  5:对于频繁查找的字段优先使用覆盖索引

    避免 Innodb 二次查找

    可以把随机IO 变为顺序 IO 加快效率 

字段设计规范

选择合适的字段类型会很大程度上提高整体性能

  1:优先选择符合存储需要的最小数据类型

    对无符号数据采用无符号存储,比如 INT 类型,储存为无符号数据的话会节省这个字段一半存储空间

    VARCHAR(N) 中 N 代表的是字符数,而不是字节数

    使用 UTF-8 储存汉字 VARCHAR(255) = 755字节。

    过大的长度会消耗更多的内存。

   2:避免 TEXT 这种数据类型

    text 这种字段的话, 建议分离单独的表中,和主表在一起的话会极大的耗费性能

    

  3:建议把所有列定义为 NOT NULL

    字段为 NULL  时,运算时会进行特别处理。

    设置为 NOT NULL 也是对程序的一种保护,防止错误数据的产生。

  4:不建议储存时间类型为字符串

    mysql 有专门为时间类型使用的字段,使用它们可以更高效。

    不建议使用 VARCHAR()/INT() 等存储。

    浪费。    

    建议使用 DATAETIME/TIMESTAMP 储存

    TIMESTAMP 占用 4 字节,与 INT 相同,但是比 INT 可读性更高

    超出 TIMESTAMP(1970-2038) 范围的,使用 DATAETIME

  5:财务相关的,必须使用decial精确浮点类型

    -- 计算 不丢失精度

    -- 可以保存比bigint更大的整数数据

SQL 规范

   1: 避免隐式转换

    

    比如这里有一个字段,`table_id` 是一个 INT 类型的字段,但是我在查询时候使用这样的语句

    select * from `table` where id = '1';

    在where 子句中,1 变为了字符串成为了查询条件。

    这时 MYSQL 等于是在内部又进行了一次隐式转换,在开发时,我们应该避免这种情况的发生。

    它可能会 导致索引失效

  2:禁止 select *

    搜索到大量无用数据

    无法使用覆盖索引

  3:禁止使用不含字段列表的insert

    比如像这种 INSERT INTO `table_name` values ('a','b','c');

    虽然在当时是可以使用的,可是如果之后添加了新字段等等,会导致数据的混乱,所以我们应该禁止这种行为。

  4:禁止使用子查询

    在子查询时,子查询获得的结果集并不能使用索引。

    子查询也是等于会在 mysql 中建立一个临时表来存储这个数据,大量的使用子查询,会导致临时表消耗大量的消耗IO/CPU

    建议使用 Join 。

  

  5:避免 join 关联过多表

    mysql join 最多可以关联 61 个,但是最好不要超过 5 个。

    每次多关联一个表,就会多消耗一份内存。

原文地址:https://www.cnblogs.com/25-lH/p/9153958.html