SQL-联结表

SQL最强大的功能之一就是在select中执行联结表(inner)。联结表是利用SQL的select语句能执行的最重要的操作,很好地理解联结及其语法是学习SQL的极其重要的部分。

首先,要理解什么是关系表。

为了避免相同的数据出现多次,关系表的设计就是把信息分解成多个表,一类数据一个表,只要在这些表中通过一些共同的值建立连接即可。

例如要建立产品和供应商的数据库,一个产品对应一个供应商,产品还有自身的规格,价格等信息,而同一个供应商又生产不同的产品,如果将这些信息全部存在同一个表中,那么供应商的地址电话等信息发生改动时,由供应商生产的所有产品的对应信息都需要被改变。

因此,分开存储是有利于维护的,发生变更时,只用改变一次供应商表中的某条数据。

将数据分解能够更有效的存储,并且可伸缩性较好,但是在select检索时,就不如存在同一个表中方便。此时,便用到联结表啦(Join)

联结是一种机制,用来在一条select语句中关联表!!可以联结多个表返回一组输出。

比如有如下的一个表。

供应商表

产品表:

如果需要同时显示供应商name 产品name 以及产品price

那么就需要用到联结:

select vender_name,pro_name,pro_price
from vendors,products where vendors.vender_id=products.vend_id;

where语句就代表了联结。这两个表是用vender_id联结起来的。这个where语句将第一个表中的每一行与第二个表中的每一行配对了。

如果没有where语句 

select vender_name,pro_name,pro_price
from vendors,products ;

将会得到笛卡尔积(cross  join);

以上联结称为等值联结(equijoin).基于两个表之间的相等测试。也成为内联结(inner join) 也可以这样写:

sql不限制select语句中联结的表的数目,可以用where...and联结多个表。

高级联结:自联结,(self join) 自然联结(natural join),外联结(outer join);

自联结一般作为外部语句,代替从相同的表中检索数据的使用子查询语句。比如说 select ..from tableA where key1 =(select ...form tableA where key2=..)

使用自联结的话,就需要使用表的别名 tableA as c1,tableA as c2,如此再用where and 称之为自联结。

自然联结派出多次出现的列,使得每一列只返回一次。要求只能选择那些唯一的列,一般通过对一个表使用通配符select*,而对其他列使用明确的子集来完成。

关于外联结,在这里转载一下别人的博客:原文地址:http://coolshell.cn/articles/3463.html

对于SQL的Join,在学习起来可能是比较乱的。我们知道,SQL的Join语法有很多inner的,有outer的,有left的,有时候,对于Select出来的结果集是什么样子有点不是很清楚。Coding Horror上有一篇文章(实在不清楚为什么Coding Horror也被墙)通过 文氏图 Venn diagrams 解释了SQL的Join。我觉得清楚易懂,转过来。

假设我们有两张表。

  • Table A 是左边的表。
  • Table B 是右边的表。

其各有四条记录,其中有两条记录是相同的,如下所示:

id name       id  name
-- ----       --  ----
1  Pirate     1   Rutabaga
2  Monkey     2   Pirate
3  Ninja      3   Darth Vader
4  Spaghetti  4   Ninja

下面让我们来看看不同的Join会产生什么样的结果。

SELECT * FROM TableA
INNER JOIN TableB
ON TableA.name = TableB.name

id  name       id   name
--  ----       --   ----
1   Pirate     2    Pirate
3   Ninja      4    Ninja

Inner join
产生的结果集中,是A和B的交集。

Venn diagram of SQL inner join

SELECT * FROM TableA
FULL OUTER JOIN TableB
ON TableA.name = TableB.name

id    name       id    name
--    ----       --    ----
1     Pirate     2     Pirate
2     Monkey     null  null
3     Ninja      4     Ninja
4     Spaghetti  null  null
null  null       1     Rutabaga
null  null       3     Darth Vader

Full outer join 产生A和B的并集。但是需要注意的是,对于没有匹配的记录,则会以null做为值。

Venn diagram of SQL cartesian join

SELECT * FROM TableA
LEFT OUTER JOIN TableB
ON TableA.name = TableB.name

id  name       id    name
--  ----       --    ----
1   Pirate     2     Pirate
2   Monkey     null  null
3   Ninja      4     Ninja
4   Spaghetti  null  null

Left outer join 产生表A的完全集,而B表中匹配的则有值,没有匹配的则以null值取代。

Venn diagram of SQL left join

SELECT * FROM TableA
LEFT OUTER JOIN TableB
ON TableA.name = TableB.name
WHERE TableB.id IS null 

id  name       id     name
--  ----       --     ----
2   Monkey     null   null
4   Spaghetti  null   null

产生在A表中有而在B表中没有的集合。

join-left-outer.png

SELECT * FROM TableA
FULL OUTER JOIN TableB
ON TableA.name = TableB.name
WHERE TableA.id IS null
OR TableB.id IS null

id    name       id    name
--    ----       --    ----
2     Monkey     null  null
4     Spaghetti  null  null
null  null       1     Rutabaga
null  null       3     Darth Vader

产生只在A表或是B表出现的数据。

join-outer.png

还需要注意的前面说的还有一个是“交差集” cross join, 这种Join没有办法用文式图表示,因为其就是把表A和表B的数据进行一个N*M的组合,即笛卡尔积。表达式如下:

SELECT * FROM TableA
CROSS JOIN TableB

这个笛卡尔乘积会产生 4 x 4 = 16 条记录,一般来说,我们很少用到这个语法。但是我们得小心,如果不是使用嵌套的select语句,一般系统都会产生笛卡尔乘积然再做过滤。这是对于性能来说是非常危险的,尤其是表很大的时候。

原文地址:https://www.cnblogs.com/CongLollipop/p/6640431.html