两种左连接查询方式哪种好？

ta表字段：id、bid、flag、name

tb表字段：id、desc

现在要查询出flag=1的所有name及desc

方式1
SELECT a.name, b.desc FROM ta as a LEFT JOIN tb as b ON a.bid=b.id WHERE a.flag=1

方式2
SELECT a.name, b.desc FROM ( SELECT bid,name FROM ta WHERE flag=1) as a LEFT JOIN tb as b ON a.bid=b.id

这两种方式各有什么优缺点？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
leaf_cq 2022-04-08 15:54
关注
1、表结构分析：根据表结构，ta中存在tb表的id字段，姑且认为id为主键，那说明tb表为主表，而ta表为从表。如果表结构设计没有问题，那ta表中的bid字段（外键字段）应该建立有索引
2、数据量分析：
2.1、看是什么数据库，如果是PGSQL，两张表各10万以内，如果是MySQL，两张表各1万以内等等（前提是表的字段数少），怎么写都无所谓，全表扫描的效率差别可能都不大
2.2、如果两张表各100万以上，那必须看数据分布以及索引建立情况了
２.2.1、如果如上面 1 所述，在ta表中的bid中建立了索引，那应该这样写才能充分利用索引
　　SELECT ta.name, tb.desc FROM tb JOIN ta ON tb.id = ta.bid AND ta.flag = 1;
　　注意：这个是内连接，而非左连接了（下同）
2.2.2、如果 ta 表中的 flag = 1 的数据量非常少，比如仅1000以内，那使用子查询的效率可能会更高：
　　SELECT ta.name, tb.desc FROM ( SELECT bid, name FROM ta WHERE flag = 1 ) as ta JOIN tb ON tb.id = ta.bid;

2.2.3、如果表设计不是 1 中所述的样子，就是反人类的反向设计，并且bid上即没有索引，其中的值还可能为空，那只能使用左连接了
　　结合需求，根据楼主用左连接说明 ta 表中为全量数据，tb 表中可能有缺失数据，则ta表只能为主表，尽量减少主表的记录数量，能够尽可能多的避免在表连接阶段对tb表的扫描，因此采用方式2的子连接的方式更为高效，当然，还是要看flag = 1的数据量，如果超过了ta表数据量的30%~40%或者数据量超过10万行（不同数据库有所不同），可能对内存资源的要求就要高一些。

3、单从SQL结构上分析
3.1、方式一的处理过程是先进行表关联，然后再对关联后的结果集进行flag = 1的条件过滤。这种方式在flag = 1的数据量占ta表的大多数数据量时可能更高效
3.2、方式二的处理过程是先对ta表的flag = 1的条件进行过滤，再将得到的结果集与tb表进行关联。这种方式在flag = 1的数据量越少，越高效，数据量越多，越接近方式一，当flag = 1接近ta表的全量时，看数据库，可能比方式一要稍微低效一些

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

什么是大数据？
2024-08-08 13:21

越重天的博客 大数据到底是什么？大数据的定义是。这也被称为。简单来说，大数据是的数据集，尤其是来自新数据源的数据集。这些数据集非常庞大，传统数据处理软件根本无法管理它们。但这些海量数据可用于解决您以前无法解决的业务...
5种大数据数据建模方法对比：哪种最适合你的业务场景？
2025-09-09 19:12

AI Native APP 开发前沿的博客本文的目的是对5种常见的大数据数据建模方法进行全面对比，分析它们在不同业务场景下的适用性，范围涵盖了这些方法的原理、实现步骤、实际应用以及相关的工具和资源。本文将首先介绍相关的核心概念和术语，然后详细...
大数据？什么是大数据（大数据的概念）？大数据的价值？
2018-02-24 15:18

小坤师兄的博客声明：本文转至Big大鸟的博客下，转载的名为《什么叫大数据 大数据的概念》一文，链接地址http://blog.csdn.net/qq_36738482/article/details/728235091、大数据定义对于“大数据”（Big data）研究机构Gartner给...
两种主流大数据系统架构的区别，终于有人讲明白了
2022-07-15 08:00

hzbooks的博客导读：从资源管理角度来看，当前的大数据系统架构主要有两种：一种是MPP数据库架构，另一种是Hadoop体系的分层架构。这两种架构各有优势和相应的适用场景。本文主要讲这两种架构的区别。同样都可以处理大规模数据的...
如何下载era5数据？（两种方式）
2024-12-11 13:13

Camiel12138的博客供水利大数据云计算课程同学参考使用#
什么是大数据？大数据能做什么？
2019-12-09 15:38

大数据基础入门教程的博客本篇文章主要为我们介绍了大数据的概念、发展以及相关应用。 “Big Data is like teenage sex:Everyone talks about it，nobody really knows how to do it，everyone thinks everyone else is doing it，so ...
单表查询和多表连接查询哪个效率更快？
2021-06-21 20:33

不会编程的派大星的博客这段时间在做项目的过程中，遇到一个模块，数据之间的联系很复杂，在建表的时候就很纠结，到底该怎么去处理这些复杂的数据呢，是单表查询，然后在业务层去处理数据间的关系，还是直接通过多表连接查询来处理数据关系...
大数据Spark技术分享威胁检测和规模响应共25页.pdf
2024-07-18 16:10

数据流的处理通常涉及两种主要的连接方式：左连接（left join）以及内连接（inner join）。左连接用于包含上下文信息的数据流处理，而内连接用于结合具体的威胁指标。其次，大规模响应（Scale）指的是在检测到潜在...
Hive查询的18种方式，你都学会了吗?
2020-12-05 10:14

大数据梦想家的博客 Hive查询的18种方式，确定不点击进来学习一下吗？
大数据新视界 --大数据大厂之 Druid 查询性能提升：加速大数据实时分析的深度探索
2024-10-04 20:11

青云交的博客本文深入探讨 Druid 查询性能优化。阐述 Druid 架构，分析数据存储、摄入方式与查询性能的关系，介绍优化策略如存储格式、索引维护、摄入模式调整和查询语句优化，还通过交通、游戏等行业案例展示优化效果。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月8日

两种左连接查询方式哪种好？

3条回答 默认 最新

问题事件

3条回答默认最新