MySQL中的联表查询与子查询

0.准备数据
1.内连接：INNER JOIN
2.左连接：LEFT JOIN
3.右连接：RIGHT JOIN
4.USING子句
扩展知识点：
- 0.表别名的使用：
- 1.group by的用法
- 2.子查询
  - 1）不相关子查询
  - 2）相关子查询

JOIN的含义就如英文单词“join”一样，连接两张表，语法如下所示：

SELECT * FROM A INNER|LEFT|RIGHT JOIN B ON condition

JOIN 按照功能大致分为如下三类：

INNER JOIN（内连接,或等值连接）：取得两个表中存在连接匹配关系的记录。

LEFT JOIN（左连接）：取得左表（A）完全记录，即是右表（B）并无对应匹配记录。

RIGHT JOIN（右连接）：与 LEFT JOIN 相反，取得右表（B）完全记录，即是左表（A）并无匹配对应记录。

注意：mysql不支持Full join,不过可以通过UNION 关键字来合并 LEFT JOIN 与 RIGHT JOIN来模拟FULL join

0.准备数据

表	表数据	命令
blog 记录文章名与文章类型		create table blog( id INT primary key auto_increment, title_name varchar(40), title_type int ); insert into blog values(0,'aa',1),(0,'bb',2),(0,'cc',3),(0,'dd',4),(0,'ee',3),(0,'ff',2),(0,'gg',default),(0,'hh',6);
blog_type 记录文章类型		create table blog_type( id INT primary key auto_increment, name varchar(40) ); insert into blog_type values(0,'C'),(0,'PYTHON'),(0,'JAVA'),(0,'HTML'),(0,'C++');

表

表数据

命令

blog 记录文章名与文章类型

create table blog(

id INT primary key auto_increment,

title_name varchar(40),

title_type int

);

insert into blog values(0,'aa',1),(0,'bb',2),(0,'cc',3),(0,'dd',4),(0,'ee',3),(0,'ff',2),(0,'gg',default),(0,'hh',6);

blog_type 记录文章类型

create table blog_type(

id INT primary key auto_increment,

name varchar(40)

);

insert into blog_type values(0,'C'),(0,'PYTHON'),(0,'JAVA'),(0,'HTML'),(0,'C++');

1.内连接：INNER JOIN

内连接INNER JOIN/JOIN是最常用的连接操作。从数学的角度讲就是求两个表的交集:

select * from blog inner join blog_type on blog.title_type=blog_type.id;
select * from blog join blog_type on blog.title_type=blog_type.id;
select * from blog,blog_type where blog.title_type=blog_type.id;

输出结果：

2.左连接：LEFT JOIN

左连接LEFT JOIN的含义就是求两个表的交集外加左表剩下的数据，左连接从左表(A)产生一套完整的记录,与匹配的记录(右表(B)) .如果没有匹配,右侧将包含null。

select * from blog left join blog_type on blog.title_type=blog_type.id;

如果想只从左表(A)中产生一套记录，但不包含右表(B)的记录，可以通过设置where语句来执行，如下：

select * from blog left join blog_type on blog.title_type=blog_type.id where blog_type.id is null;

3.右连接：RIGHT JOIN

同理右连接RIGHT JOIN就是求两个表的交集外加右表剩下的数据。

select * from blog right join blog_type on blog.title_type=blog_type.id;

4.USING子句

MySQL中连接SQL语句中，ON子句的语法格式为：table1.column_name = table2.column_name。当模式设计对联接表的列采用了相同的命名样式时，就可以使用 USING 语法来简化 ON 语法，格式为：USING(column_name)。所以，USING的功能相当于ON，区别在于USING指定一个属性名用于连接两个表，而ON指定一个条件。另外，SELECT *时，USING会去除USING指定的列，而ON不会。实例如下。

create table blog_type_1 as select * from blog_type;

alter table blog_type drop id;

alter table blog_type add title_type int not null primary key auto_increment first;

mysql	结果
select * from blog inner join blog_type on blog.title_type=blog_type.title_type;
select * from blog join blog_type using(title_type); USING会去除USING指定的列

mysql

结果

select * from blog inner join blog_type on blog.title_type=blog_type.title_type;

select * from blog join blog_type using(title_type);

USING会去除USING指定的列

join中改善性能的一些注意点：来自https://www.cnblogs.com/fudashi/p/7506877.html

小表驱动大表能够减少内循环的次数从而提高连接效率。
在被驱动表建立索引能够提高连接效率
优先选择驱动表的属性进行排序能够提高连接效率

扩展知识点：

0.表别名的使用：

对单表做简单的别名查询通常是无意义的。一般是对一个表要当作多个表来操作，或者是对多个表进行操作时，才设置表别名。

1.group by的用法

MySQL之group by的使用

2.子查询

嵌套在其它查询中的查询称之为子查询或内部查询，包含子查询的查询称之为主查询或外部查询

1）不相关子查询

内部查询的执行独立于外部查询，内部查询仅执行一次，执行完毕后将结果作为外部查询的条件使用

一般在子查询中，程序先运行在嵌套在最内层的语句，再运行外层。因此在写子查询语句时，可以先测试下内层的子查询语句是否输出了想要的内容，再一层层往外测试，增加子查询正确率。否则多层的嵌套使语句可读性很低。

举栗：想要从数据库中获取文章类型是Python的文章列表

A	B
select title_name from blog where title_type= (select id from blog_type_1 where name='PYTHON');	select title_name from blog A join blog_type_1 B on A.title_type=B.id where B.name='PYTHON';

分步执行：

获取id: select id from blog_type_1 where name='PYTHON';---->id=2

获取文章列表：select title_name from blog where title_type=2;-→title name=(bb,ff)

联合查询：

子查询的方式：select title_name from blog where title_type=(select id from blog_type_1 where name='PYTHON');

联表查询的方式：select title_name from blog A join blog_type_1 B on A.title_type=B.id where B.name='PYTHON';

2）相关子查询

内部查询的执行依赖于外部查询的数据，外部查询每执行一次，内部查询也会执行一次。每一次都是外部查询先执行，取出外部查询表中的一个元组，将当前元组中的数据传递给内部查询，然后执行内部查询。

根据内部查询执行的结果，判断当前元组是否满足外部查询中的where条件，若满足则当前元组是符合要求的记录，否则不符合要求。然后，外部查询继续取出下一个元组数据，执行上述的操作，直到全部元组均被处理完毕。

举栗：从历史最好记录的表中获取各个指标最新时间的值

表数据：

蓝色框框中的fr指标数据是重复的，预期想要获取各个指标最新时间的指标值

相关子查询	联表查询
select * from test_best_history_for_storm_largescale t where date =(select max(date) from test_best_history_for_storm_largescale where fr=t.fr and area="largescale_fuji") and area="largescale_fuji";	select * from test_best_history_for_storm_largescale A join (select max(date) date,fr from test_best_history_for_storm_largescale where area='largescale_fuji' group by fr)B on A.date=B.date and A.fr=B.fr and A.area='largescale_fuji';

另一种子查询方式：

select * from best_history_for_storm_largescale a where not exists (select * from best_history_for_storm_largescale b where a.area=b.area and a.best_history_data+0<b.best_history_data+0 and a.fr=b.fr) and a.area='largescale_fuji';

在复习这一块的知识点使用较大数据量进行测试时，发现使用子查询使用的时间要比联表查询长，后续有时间会再比较性能问题。

参考：https://www.cnblogs.com/fudashi/p/7491039.html