为什么最自然的查询（即使用INNER JOIN（而不是LEFT JOIN））非常慢

（按照指示，我将部分评论放入答案中，因为它可以解决问题）

将EXISTS表达式转换为IN表达式。

在这种情况下，这种方法效果更好，因为从包含您最大限制因素（全文搜索查找）的查询开始，现在将从“由内而外”对查询进行有效的评估。该查询将返回一小组行，可以直接针对外部查询的主键（在（SELECTX …）中的WHERex）进行查询，而不是针对每个的值调用“内部”查询外部查询（如果我正确阅读，则查询原始情况下的所有值）。在这里，EXISTS方法导致嵌套循环（对一个查询的另一个值进行一次求值），而使用散列连接（在许多情况下，即使不是大多数情况下，效率更高的执行方法）下的IN方法也是如此。

注意，使用EXISTS方法，有四个嵌套循环，每个循环执行至少3,000次。那笔费用加起来。虽然这不是直接比较，但是您可以像处理应用程序代码中的FOR循环那样对待嵌套循环：每次调用内部循环时，big-
O估计都会增加一个数量级：O（n）到O（n ^ 2）到O（n ^ 3）等

哈希联接更像是一个映射，其中两个数组同时执行，并对两个数组执行操作。这大致是线性的（O（n））。考虑将这些嵌套为加法器，这样它将从O（n）到O（2n）到O（3n），依此类推。

是的，是的，我知道这不是完全相同的事情，但是我要指出的是，具有多个嵌套循环通常表示查询计划很慢，并且比较这两种big-O样式可以使其更容易识别。

嵌套循环和EXISTS本身并不是邪恶的，但是在大多数情况下，存在一个基本过滤条件最终会影响所有内容（例如，问题中的全文本搜索），一个IN表达式（或者在
某些情况下，一个适当的JOIN）可产生效率更高的计划。

为什么最自然的查询（即使用INNER JOIN（而不是LEFT JOIN））非常慢

面试问答相关栏目本月热门文章