MYSQL统计和识别重复值

640?wx_fmt=jpeg

1、查询和计算表person_tbl中（last_name，first_name）组合有重复的记录的数量。

mysql> SELECT COUNT (*) AS repetitions, last_name, first_name

FROM person_tbl GROUP BY last_name, first_name

HAVING repetitions > 1;

2、从结果集中消除重复记录

使用DISTINCT关键字即可从结果集中消除重复记录。

mysql> SELECT DISTINCT last_name, first_name

FROM person_tbl

ORDER BY last_name;

使用GROUP BY子句。

mysql> SELECT last_name, first_name

FROM person_tbl

GROUP BY (last_name, first_name);

3、删除表中的重复记录

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex

FROM person_tbl;

GROUP BY (last_name, first_name);

mysql> DROP TABLE person_tbl;

Mysql> ALTER TABLE tmp RENAME TO person_tbl;

还有一个不为人知的技巧，可以直接在一个有重复记录的表上加上主键或唯一索引，可使用ALTER IGNORE语句，命令如下。

mysql> ALTER IGNORE TABLE person_tbl

ADD PRIMARY KEY (last_name, first_name);

可以使用如上的方法消除重复记录，并且确保以后都有唯一约束。

也可以采用如下的方式，直接删除重复数据，如下语句将删除name相同的数据，其中id是主键。

DELETE t1 FROM table1 AS t1 JOIN table1 AS t2 ON t1.id>t2.id AND t1.name=t2.name;

文章基于MySQL DBA修炼之道整理，版权属于原作者