数据库海量数据导入

1.如果是单库导入,最好用load data

1.source方法慢,且会在binlog中生成大量的对应的sql,SOURCE每8000行记录左右提交一次, 也可在二进制日志中得到印证. 若某条记录出错, 其所在分组会进行回滚. 
至于为什么是8000, 暂且理解为内部机制了.
2.load data方法快,分析其产生的二进制日志, 可以发现LOAD将该过程作为一个事物了,若LOAD遇到错误, 如数据类型不对, 或数据列不匹配等, 整个过程就会回滚.

3.如果是mycat集群导入数据,最好从mycat处导入

2.

原文地址:https://www.cnblogs.com/hbxZJ/p/10253729.html