为啥数据库查询条件全查询比不加要快？

select * from table
where
<choose>
    <when test="list == null">
        id in (select id from table2)
    </when>
    <otherwise>
        id in 
        <foreach collection="list" item="item" open="(" separator="," close=")" index="index">
            #{item}
        </foreach>
    </otherwise>
</choose>

otherwise里面是一部分的table2的id数据

上面的效率比下面的快

select * from table
where
<if test="list != null">
    id in 
    <foreach collection="list" item="item" open="(" separator="," close=")" index="index">
        #{item}
    </foreach>
</if>

为啥？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-30 09:53
关注
引自免费微信小程序：皆我百晓生

在分析这个问题时，我们需要考虑SQL查询执行计划以及数据分布情况。首先，我们来看一下两个查询的区别。

第一个查询（全查询）：

SELECT * FROM table WHERE CASE WHEN list IS NULL THEN id IN (SELECT id FROM table2) ELSE id IN ( SELECT #{item} FROM DUAL UNION ALL SELECT #{item} FROM DUAL -- 重复次数等于list中的元素个数 ) END;

这里，当list为null时，会进行table与table2之间的连接查询；否则，会对每个list中的元素分别创建一个子查询，然后将这些子查询的结果合并在一起。这可能导致额外的处理开销，特别是当list较大时，因为每次循环都会产生一个新的子查询。

第二个查询（非全查询）：

SELECT * FROM table WHERE list IS NOT NULL AND id IN ( SELECT #{item} FROM DUAL UNION ALL SELECT #{item} FROM DUAL -- 重复次数等于list中的元素个数 );

这个查询仅在list不为空时执行，这样就省去了判断逻辑，并且只对list中的元素进行一次并集操作。

那么为什么全查询可能会更快呢？这可能有以下几个原因：

索引利用：如果table的主键或id字段上有索引，而table2的id字段没有索引，那么对于全查询来说，在list为null时，由于使用了表连接，可能会导致索引失效，从而降低性能。然而，由于实际执行计划依赖于数据库的具体实现、统计信息和优化器策略，所以这并不总是成立。

执行计划缓存：如果list经常为空，数据库可能会更频繁地优化和缓存全查询的执行计划，因为它的结构更稳定。而针对非全查询的执行计划可能因为list内容的变化而变化，这可能会导致执行计划的重新编译和优化，增加了额外的时间开销。

内存消耗：在非全查询中，由于每次循环都创建了一个新的子查询，这可能会占用更多内存用于存储这些临时结果。而在全查询中，即使存在多余的子查询，它们可能会被优化器合并或者忽略，减少内存使用。

数据分布：如果table和table2的数据分布非常特殊，例如大部分id值在table2中，那么全查询可能会利用到索引来快速过滤掉大量行，从而提高整体性能。

优化器决策：不同的数据库管理系统（DBMS）有不同的查询优化器，它们会选择不同的执行路径。有些情况下，优化器可能会认为全查询的执行计划更优，尽管它看起来更复杂。

为了准确评估哪个查询更好，你需要根据具体的数据库类型（如MySQL、PostgreSQL、Oracle等）、表的实际大小、索引状况以及数据分布来运行基准测试。同时，查看执行计划可以帮助理解查询是如何被执行的，这对于优化查询特别有用。如果你能提供这些详细信息，我可以帮你进一步分析。
解决
无用 1
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

MongoDB 数据库操作-大数据实验四
2024-11-23 00:21

内容概要：本文档为安徽工程大学大数据存储与处理课程的实验报告，主要内容涵盖了MongoDB数据库的基本操作，包括启动集群服务、创建和删除数据库、集合操作（如插入数据、查询数据、排序、限制查询结果等）。...
【大数据】分布式数据库HBase
2024-04-26 15:21

_BugMan的博客一文聊明白分布式数据库HBase
大数据面试题：HBase为什么查询快
2023-06-22 12:04

蓦然_的博客 HBase为什么查询快
大数据为什么那么快?为什么要使用大数据而不使用传统数据?
2019-10-31 22:02

旗哥说 Ai的博客我们从与传统服务器的对比来进行今天的知识普及,从扩展性,分布式,可用性,以及计算模型来分析一下,大数据为什么这么快? 传统数据 大数据 扩展性纵向扩展横向扩展分布式资源集中 ...
Java提升数据库大数据查询速度的几种方式
2023-03-01 11:17

吾疾唯君医的博客 Java提升数据查询速度常见的几种方案
大数据场景下时序数据库选型指南，Apache IoTDB的领先技术和实践
2025-09-17 16:36

Lion 莱恩呀的博客文章首先指出物联网设备产生的海量时序数据对传统数据库的挑战，强调TSDB在高效存储、快速查询和实时分析方面的专业性。随后系统性地提出了时序数据库选型的五大关键维度：数据模型与存储效率、读写性能、可扩展性、...
大数据生态数据库技术选型
2023-05-18 15:44

猿来如此dj的博客 大数据生态数据库特性分析。
postgresql大数据查询加索引和不加索引耗时总结
2018-09-20 22:15

朔语的博客 1、创建测试表 CREATE TABLE big_data ...当前结果仅适用于创建的big_data这张数据表（如果数据表中字段比较多，数据量比较大，会在更小的查询结果记录数出现加索引查询效率提升不明显的问题）。
如何处理大数据量下的数据库查询优化？
2024-11-12 08:36

破碎的天堂鸟的博客在处理大数据量下的数据库查询优化时，可以采取多种策略和技术来提高查询性能和效率。：合理设计和使用索引是提高查询性能的重要手段。例如，选择合适的索引类型（如B树索引或位图索引）可以显著减少查询执行期间...
【大数据】bigtable，分布式数据库的鼻祖
2024-04-20 09:51

_BugMan的博客看懂这一篇，就能理解分布式数据库的核心，详聊分布式数据库的鼻祖bigtable。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月30日

为啥数据库查询条件全查询比不加要快？

为啥数据库查询条件全查询比不加要快？

2条回答 默认 最新

问题事件

2条回答默认最新