(按照指示,我将部分评论放入答案中,因为它可以解决问题)
将EXISTS表达式转换为IN表达式。
在这种情况下,这种方法效果更好,因为从包含您最大限制因素(全文搜索查找)的查询开始,现在将从“由内而外”对查询进行有效的评估。该查询将返回一小组行,可以直接针对外部查询的主键(在(SELECTX …)中的WHERex)进行查询,而不是针对每个的值调用“内部”查询外部查询(如果我正确阅读,则查询原始情况下的所有值)。在这里,EXISTS方法导致嵌套循环(对一个查询的另一个值进行一次求值),而使用散列连接(在许多情况下,即使不是大多数情况下,效率更高的执行方法)下的IN方法也是如此。
注意,使用EXISTS方法,有四个嵌套循环,每个循环执行至少3,000次。那笔费用加起来。虽然这不是直接比较,但是您可以像处理应用程序代码中的FOR循环那样对待嵌套循环:每次调用内部循环时,big-
O估计都会增加一个数量级:O(n)到O(n ^ 2)到O(n ^ 3)等
哈希联接更像是一个映射,其中两个数组同时执行,并对两个数组执行操作。这大致是线性的(O(n))。考虑将这些嵌套为加法器,这样它将从O(n)到O(2n)到O(3n),依此类推。
是的,是的,我知道这不是完全相同的事情,但是我要指出的是,具有多个嵌套循环通常表示查询计划很慢,并且比较这两种big-O样式可以使其更容易识别。
嵌套循环和EXISTS本身并不是邪恶的,但是在大多数情况下,存在一个基本过滤条件最终会影响所有内容(例如,问题中的全文本搜索),一个IN表达式(或者在
某些 情况下,一个适当的JOIN)可产生效率更高的计划。



