mysql数据库大表加索引

最近大后台查看一些数据统计的时候，很慢，甚至会有超时情况，前端设置的超时时间是20秒。

后来通过查看日志和慢查询，发现一条sql语句执行时间超过18秒，基本都19秒左右。

 select count(*) from tb_name where create_time > xxx;

最终得知是因为这个表数据行数已经超过一千万了，然后create_time字段又没有索引。

那解决办法肯定是加索引喽。

但是这个表是一直在线上运行，很重要和业务部分。如果给千万级的大表在线加索引，肯定会卡死。

然后就搜罗了一大筐解决方案，比如在线无锁加索引使用

ALTER TABLE tbl_name ADD PRIMARY KEY (column), ALGORITHM=INPLACE, LOCK=NONE;

后来才发现，这个特性是Mysql 5.6以后才支持，然而我们的mysql用的是5.5版本

最后在《高性能Mysql》一书中看到，可在通过 “影子拷贝”来解决，

就是 先创建一张和源表无关的新表，然后通过重命名和删表操作交换两张表；

#操作步骤：
#1、创建一张和原表结构一样的空表，只是表名不一样
    create table tb_name_tmp like tb_name;

#2、把新建的空表非主键索引都删掉，因为这样在往新表导数据的时候效率会很快（因为除了必要的主键以外，不用再去建立其它索引数据了）
    alter tb_name_tmp drop index index_name;

#3、从旧表往主表里导数据，如果数据太大，建议分批导入，只需确保无重复数据就行，因为导入数据太大，会很占用资源(内存，磁盘io, cpu等)，可能会影响旧表在线上的业务。我是每批次100万条数据导入，基本上每次都是在 20s左右
    insert into tb_name_tmp select * from tb_name where id between start_id and end_id;

#4、数据导完后，再对新表进行添加索引
     create index index_name on tb_name_tmp(column_name);

#5、当大部分数据导入后，索引也建立好了，但是旧表数据量还是会因业务的增长而增长，这时候为了确保新旧表的数据一至性和平滑切换，建议写一个脚本，判断当旧表的数据行数与新表一致时，就切换。我是以 max(id)来判断的。
    rename table tb_name to tb_name_tmp1;
    rename table tb_name_tmp to tb_name;

当给新表加完索引后，最上面那条查询直接就是0.0002s

Talk is cheap, show me the code.