Mysql sql语句技巧与优化

一、常见sql技巧

  1、正则表达式的使用

    

  2、巧用RAND()提取随机行

      mysql数据库中有一个随机函数rand()是获取一个0-1之间的数,利用这个函数和order by一起能够吧数据随机排序,

、       mysql>select * from stu order by rand();

      下面是通过limit随机抽取了3条数据样本。

        mysql>select * from stu order by rand() limit 3;

  3、利用GROUP BY 的WITH ROLLUP子句统计

      使用group by的with rollup子句可以检索出更多的聚合信息。

        mysql>select cname,pname,count(pname) from demo group by cname,pname;

        同样使用with rollup关键字后,统计出更多的信息。注意:with rollup不可以和order by同时使用。

        mysql>select cname,pname,count(pname) from demo group by cname,pname with rollup;

  4、用BIT GROUP FUNCTIONS 做统计

      在使用group by语句时可以同时使用bit_anf、bit_or函数来完成统计工作,这两个函数的主要作用是做数值之间的逻辑位运算。

        mysql>select id,bit_or(kind) from order_rab group by id;      //二进制位运算

        对order_rab表中id分组时对kind做位与和或计算。

        mysql>select id,bit_and(kind) from order_rab group by id;    //二进制余运算,只有11才为1

  5、使用外健要注意的问题

      创建外健如下:

        mysql>create table temp(id int,name char(20),foreign key(id) references outTable(id) on delete cascade on update cascade));

        注意:innodb类型的表支持外健,myisam类型的表,虽然创建可以成功,但不起作用,主要原因是不支持外健。

  6、mysql中help的使用

      a、?%可以获得所有mysql>里的命令,

      b、?create

      c、?opt%,因为记不住全称。

二、mysql的优化

  1、优化sql语句的一般步骤

      通过show status命令了解各种sql的执行频率。

        格式:mysql>show [session|global] status;

          session:(默认)表示当前链接

          globla:表示自数据库启用至今

        如:mysql>show status;

          mysql>show global status;

          mysql>show status like "Com_%";

          mysql>show global status like "Com_%";

        参数说明:

          Com_select 执行select操作的次数,一次查询值累计加1

          Com_update 执行update操作的次数

          Com_insert 执行insert操作的次数

          Com_delete 执行delete操作的次数

        只针对Innodb引擎的:

          InnoDB_rows_read执行select操作的次数

          InnoDB_rows_update执行update操作的次数

          InnoDB_rows_insert执行insert操作的次数

          InnoDB_rows_delete执行delete操作的次数

        其他:

          connections链接mysql的数量

          Uptime服务器已经工作的秒数

          Slow_queries慢查询的次数

  2、定位执行效率较低的sql语句:

      a、explain select * from table where id = 1000;

      b、desc select * from table where id = 1000;

          

          

    c、优化的顺序:

        1)查看慢查询日志,日志里查询超过10秒的说明产寻幽问题

        2)通过desc定位这条语句哪里有问题。

        3)通过方案对问题点进行优化,如加索引

  2、索引问题

      索引实数据库优化中最常见的也是最重要的手段之一,通过索引通常可以帮助用户姐绝大多数的sql性能问题。

      1)索引的存储和分类:

          MyISAM存储引擎的表的数据和索引是自动分开存储的,各自是独一的一个文件;InnoBDB存储引擎的表的数据和索引是存储在同一个表空间里面,但可以由多个文件组成。

          mysql目前不支持函数索引,但是能对列的前面某一部分进行进行索引,例如name字段,可以去name的前2个字符进行索引,这个特性可以大大缩小文件的大小,用户在设计表结构的时候也可以对文本列根据此特性进行灵活设计。

            mysql>create index ind_company2_name on company2(name(4));//company表名,ind_company2_name索引名

      2)mysql如何使用索引

          索引用于快速找出在某个列中有一特定值的行。对相关列使用索引是提高SELECT操作性能的最佳途径。

          a、使用索引

            (1)对于创建的多行索引,只要查询的条件中用到最左边的列,索引一般就会被使用。如下创建一个复合索引。

                mysql>create index ind_sales2_com_mon onsales2(company_id,moneys);

              然后按company_id进行查询,发现使用到了复合索引。

                mysql>explain select * from sales2 where company_id=2006G;

              使用下面的查询就没有使用复合索引。

                mysql>explain select * from sales2 where moneys=1G;

            (2)使用like的查询,后面如果是常量并且只有%号不在第一个字符,索引才可能被使用,如下:

                mysql>explan select * from company2 where name like "%3"G;

                

        3)存在索引但不使用索引

            (1)如果mysql估计使用索引比全表扫描更慢,则不使用索引。例如如果列key_prat1均匀分布在1-100之间,查询时使用索引就不是很好

                mysql>select * from table_name where ley_part1>1 and key_part<90;

            (2)如果使用MEMORY/HEAP表并且where条件中不使用“=”进行索引列,那么不会用到索引。Heap表只有在“=”的条件下使用索引。

            (3)用or分割的条件,如果or前的条件中的列有索引,二后面的列没有索引,那么涉及的索引都不会用到。

            (4)如果不是索引列的第一部分,如下例子:可见虽然在money上面建有复合索引,但是由于money不是索引的第一列,那么在查询中,这个索引也不会被mysql采用。

                mysql>explan select * from sales2 where moneys=1G;

                

            (5)如果like是一%开始,可见虽然在name上家有索引,但是由于条件中的like的值的“%”在第一位了,那么mysql也不会采用这个索引。

            (6)如果列类型是字符串,但在查询时把第一个数值型常量赋值给了一个字符类型的列名name,那么虽然在name列上有索引,但是也没有用到。

                mysql>explain select * from company2 where name=294G;

                

       4)查看索引的使用情况

          如果索引正在工作,Handler_read_key的值将很高,这个值代了一个行别索引值读的次数。

          Handler_read_next的高则意味着查询运行低效,并且应该建立索引补救。

          

  3、两个简单的优化方法

      对于多数开发人员来说,可能希望掌握一些简单实用的优化方法,对于更堵更复杂的优化,更倾向于交给作业dba来做。

      1)定期分析表和检查表

        ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tal_name[,tbl_name]....

          本语句用于分析和储存表的关键字分布,分析的结果将可以得到准确的统计信息,使得sql能够生成正确的行计划。

          

          

      2)定期优化表

          

  4、常用sql的优化

      1)大批量插入数据。

          当用load命令导入数据库的时候,适当设置可以提高导入速度。

          对于myisam存储引擎的表,可以通过以下方式快速的导入大量的数据。

            ALTER TABLE tbl_name DISABLE KEYS 

            loading the data

            ALTER TABLE tbl_name ENABLE KEYS

          DISABLE KEYS和ENABLE KEYS用来打开或关闭mysiam表非唯一索引的更新,可以提高速度。注意:对innodb表无效。

          

      2)关闭唯一性校验可以提高导入效率。

          再倒入数据前限制性set unique_checks=0,关闭唯一性校验,再倒入结束后执行set unique_checks=1,恢复唯一性校验可以提高到付效率。

          

          

          

      3)优化insert语句

          及两使用多个值表的insert语句,这样可以大大算短客户与数据库的连接、关闭等损耗。

          可以使用insert delayed(马上执行)语句得到更高的效率将索引文件和数据文件分别存放不同的磁盘上。

          可以增加bulk_buffer_size变量值的方法来提高速度,但是只对myisam表使用。

          当一个文件装载一个表时,使用LOAD DATA INFILE。这个通常比使用很多insert语句要快20呗。

      4)优化group bu语句

          如果查询包含group by但用户想要避免排序结果的损耗,则可以使用order by null来禁止排序:

          如下没有使用order by null 来禁止排序。

          

      5)优化order by语句

          在某些情况中,mysql可以使用一个索引来满足order by 子句,而不需要额外的排序。where条件和order by使用相同的索引,并且order by的顺序和索引顺序相同,并且order by的字段都是升序或者降序。

          

       6)优化嵌套查询

          下面是采用嵌套查询的效果(可以使用更有效的链接查询(join)替代)

          explain select * from sales2 where company_id not in (select id from complany2)G

          

          

原文地址:https://www.cnblogs.com/yuyangphpweibo/p/9044374.html