join语句中on条件与where条件的区别

大纲:on是在生成连接表的起作用,where是生成连接表之后对连接表再进行过滤

    当使用left join时,无论on的条件是否满足,都会返回左表的所有记录,对于满足的条件的记录,两个表对应的记录会连接起来,对于不满足条件的记录,那右表字段全部是null;

    当使用right join时,类似,只不过是全部返回右表的所有记录

    当使用inner join时,功能与where完全相同。

案例实践:

  数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。

  在使用left join时,on和where条件的区别如下:

1、on条件是在生成临时表时使用的条件,它不管on中的条件是否为真,都会返回左边表中的记录。

2、where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有left join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。

假设有两张表:

表1:tab2

id size
1 10
2 20
3 30

表2:tab2

size name
10 AAA
20 BBB
30 CCC

两条SQL:

  1、select * from tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name='AAA'

  2、select * from tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=‘AAA’)

第一条SQL的过程:

1、中间表on条件:tab1.size = tab2.size

tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
20
BBB
2
20
20
CCC
3
30
(null)
(null)

2、再对中间表过滤where条件:tab2.name=‘AAA’

tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA

第二条SQL的过程:

1、中间表on条件:tab1.size = tab2.size  and  tab2.name = ‘AAA’

tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
(null)
(null)
3
30
(null)
(null)

以上结果的关键原因是left join,right join,full join的特殊性,不管on上的条件是否为真都会返回left或right表中的记录,full则具有left和right的特性的并集,而inner jion没有这个特殊性,则条件放在on中和where中,返回的结果集是相同的。

注:所有的连接条件必需要放在ON后面,不然前面的所有LEFT和RIGHT关联将作为摆设,而不起任何作用。

on、where、having的区别

  on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后。有时候如果这先后顺序不影响中间结果的话,那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的。

  根据上面的分析,可以知道where也应该比having快点的,因为它过滤数据后才进行sum,所以having是最慢的。但也不是说having没用,因为有时在步骤3还没出来都不知道哪个记录才符合要求时,就要用having了。

  在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢。

  如果要涉及到计算的字段,就表示在没计算之前,这字段的值是不确定的,根据之前的执行流程,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下两者的结果会不用。

  在多表联接查询时,on比where更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再i决定放在哪里。