当前位置：首页 > 问答 > 正文

那些你总忘记的SQL知识点，整理好了别错过收藏

整理自知乎、CSDN、博客园等技术社区常见讨论帖及个人经验总结）

你是不是有时候写SQL,突然就卡壳了，某个语法怎么都想不起来，或者写出来的结果总是不对？别担心，这太正常了，SQL看似简单，但总有一些细节像“小妖精”一样，在你最需要的时候溜走，我把这些容易忘记的点给你整理了一下，希望能帮你省下反复查文档的时间。

JOIN 连接那些事儿：ON 和 WHERE 的位置陷阱

我们都知道 JOIN 用来连接表，但过滤条件放在 ON 后面还是 WHERE 后面，效果可能天差地别。

对于 INNER JOIN（内连接）：你把条件放在 ON 后面还是 WHERE 后面，最终结果是一样的，数据库会先根据 ON 条件连接表，再用 WHERE 过滤，但因为内连接只返回匹配的行，所以最终效果没区别，很多人就因此以为所有 JOIN 都一样。
对于 LEFT/RIGHT JOIN（左/右外连接）：这里就是关键了！条件放的位置不同，结果完全不同。
- 条件在 ON 后面：这个条件是连接条件，它决定了右表（对于 LEFT JOIN）哪些行会被匹配进来，即使右表没有匹配的行，左表的所有行依然会被保留，右表部分以 NULL 填充。
- 条件在 WHERE 后面：这个条件是结果集过滤条件，它是在连接操作完成之后才应用的，这意味着，如果你在 WHERE 子句中对来自右表的字段进行过滤（WHERE table_b.column IS NOT NULL），它会将那些因为左连接而产生的 NULL 行也过滤掉，这样一来，LEFT JOIN 的效果就瞬间变成了和 INNER JOIN 一样，因为你把左表独有的那些行都删掉了。

简单记：ON 是决定“怎么连”，WHERE 是决定“连完之后留哪些”，搞混了，左连接就白写了。

* COUNT() 和 COUNT(列名) 的区别，不是你想的那样**

你以为 COUNT(column_name) 是统计该列不为 NULL 的行数，而 COUNT(*) 是统计所有行数，这没错，但陷阱在于：

COUNT(*) 是 SQL 标准中规定的统计行数的方法，数据库会对它进行优化，速度通常很快。
COUNT(1) 和 COUNT(*) 在绝大多数现代数据库管理系统（如 MySQL, PostgreSQL）中，性能几乎没有区别，数据库优化器很聪明，知道你的意图，所以不必纠结用哪个。
真正的区别在于 COUNT(column_name)，它会先取出该列所有的值，然后判断每个值是否为 NULL，再计数，如果该列上有索引，数据库可能会选择扫描更小的索引来计数，这会比 COUNT(*) 快，但如果该列允许 NULL 值，且 NULL 值很多，或者没有索引，那性能可能就不如 COUNT(*) 了。

*如果你只是想统计表里有多少条记录，放心大胆地用 `COUNT()`。**

GROUP BY 分组后的筛选：HAVING 和 WHERE 的“职权范围”

这个点初学时分不清,老手偶尔也会糊涂。

WHERE：在 GROUP BY 分组之前 进行过滤，它用来排除那些你根本不想参与分组计算的个体记录，它后面不能跟聚合函数（如 SUM, AVG），你想计算每个部门工资超过5000元的员工的平均工资，工资>5000”这个条件就要放在 WHERE 里。
HAVING：在 GROUP BY 分组之后 进行过滤，它用来过滤分组后的结果集，是针对“一组数据”的过滤。HAVING 后面可以跟聚合函数，你想找出平均工资大于10000元的部门，“AVG(工资) > 10000”这个条件就必须放在 HAVING 里。

口诀：WHERE 管“个体”，HAVING 管“团体”，先 WHERE 过滤，再 GROUP BY 分组，HAVING 筛选团体。

查询语句的执行顺序，和你的书写顺序不一样

我们习惯按 SELECT ... FROM ... WHERE ... GROUP BY ... HAVING ... ORDER BY ... 的顺序写，但数据库执行时可不是这个顺序！大致的执行顺序是：

理解这个顺序非常重要！它能解释为什么你不能在 WHERE 子句中使用 SELECT 里定义的别名（因为 WHERE 执行时，SELECT 还没执行），而可以在 ORDER BY 里使用（因为 ORDER BY 在 SELECT 之后执行）。

NULL 值带来的“坑”

NULL 表示“未知”或“不存在”，它和任何值（包括它自己）比较，结果都不是 TRUE，而是 NULL（在条件判断中被视为 FALSE）。

索引失效的常见小动作

你知道加了索引会快,但有时候感觉没效果？可能是你无意中让索引失效了。

在索引列上使用函数或表达式：WHERE YEAR(create_time) = 2023 会导致 create_time 上的索引失效，应该写成 WHERE create_time >= '2023-01-01' AND create_time < '2024-01-01'。
使用左模糊或全模糊查询：WHERE name LIKE '%张' 或 WHERE name LIKE '%张%' 会导致索引失效，只有右模糊 '张%' 可能用到索引。
对索引列进行运算：WHERE salary * 10 > 10000 会导致 salary 索引失效，应改为 WHERE salary > 10000 / 10。
使用 OR 连接条件：OR 连接的条件中有一个列没有索引，那么整个查询可能都无法使用索引。