用Left join代替not in

很多人都知道在各种数据库里面 not in 的效率极其低下.例如

select * from a

where a.id not in (

select id from b

)

我们假如a表有 10万条记录,

而b表里面也有10万条记录,

那么需要的判断是 10万乘以 10万 ,则是100亿次判断.所以执行效率极其低下.

即使发现存在就返回.那么也有 100亿/2=50亿次判断.

此时,我们可以用 Left join 来进行判断则快很多

select a.* from a

left join b

on a.id=b.id

where b.id is null

我相信这句语句大家都看的懂,相对来说.这里只要进行10万数据连接,然后进行10万次判断就可以了.总共只有20万次.

而10万数据连接来说,速度是很快的.

100亿/20万相差 5万倍速度.

50亿/20万相差 2.5万倍速度.

对于这个来说,假如a 表的数据越多,则提成的越快.

当然我这个上面涉及的是 a,b表里面都没有重复的ID,假如涉及到重复的ID.则可以通过 except 等字进行过滤.从而提高连接速度.

而在 distinct 和 left join 之间的效率就需要你的经验来判断了