MYSQL统计和识别重复值

640?wx_fmt=jpeg


1、查询和计算表person_tbl中(last_name,first_name)组合有重复的记录的数量。

mysql> SELECT COUNT (*) AS repetitions, last_name, first_name

         FROM person_tbl  GROUP BY last_name, first_name

         HAVING repetitions > 1;

2、从结果集中消除重复记录

使用DISTINCT关键字即可从结果集中消除重复记录。

mysql> SELECT DISTINCT last_name, first_name

         FROM person_tbl

       ORDER BY last_name;

使用GROUP BY子句。

mysql> SELECT last_name, first_name

         FROM person_tbl

         GROUP BY (last_name, first_name);

3、删除表中的重复记录

mysql> CREATE TABLE  tmp SELECT last_name, first_name, sex

                                     FROM person_tbl;    

                              GROUP BY (last_name, first_name);

mysql> DROP TABLE person_tbl;

Mysql> ALTER TABLE tmp RENAME TO person_tbl;

还有一个不为人知的技巧,可以直接在一个有重复记录的表上加上主键或唯一索引,可使用ALTER IGNORE语句,命令如下。

mysql> ALTER IGNORE TABLE person_tbl

       ADD PRIMARY KEY (last_name, first_name);

可以使用如上的方法消除重复记录,并且确保以后都有唯一约束。

也可以采用如下的方式,直接删除重复数据,如下语句将删除name相同的数据,其中id是主键。

DELETE t1 FROM table1 AS t1 JOIN table1 AS t2 ON t1.id>t2.id AND t1.name=t2.name;

文章基于MySQL DBA修炼之道整理,版权属于原作者

原文地址:https://www.cnblogs.com/hgmyz/p/12351064.html