如何在MySQL中使用子查询优化多个连接的查询

I've defined following tables in my application to fetch the report for every district according to the training date.

wi_individual_g(ind_id, ind_district_id, ...)
wi_individual_p(ind_id,prg_id, ind_dalit (yes/no), ind_madhesi (yes/no), ...)
wi_training(trn_id, trn_start_date, trn_ben_type, ...)
wi_indv_training(trn_id, ind_id)
wi_district(dst_id,dst_name)

My problem: The report has to be generated to count individuals district-wise who are associated with the training between the given trn_start_date. The application has predefined date range with the quarters as defined below:

$quarter=array('y1q3'=>array('2013-02-01','2013-03-31'),'y1q4'=>array('2013-04-01','2013-06-30')
,'y2q1'=>array('2013-07-01','2013-09-30'),'y2q2'=>array('2013-10-01','2013-012-31'),'y2q3'=>array('2014-01-01','2014-03-31'),'y2q4'=>array('2014-04-01','2014-06-30')
,'y3q1'=>array('2014-07-01','2014-09-30'),'y3q2'=>array('2014-10-01','2014-012-31'),'y3q3'=>array('2015-01-01','2015-03-31'),'y3q4'=>array('2015-04-01','2015-06-30')
,'y4q1'=>array('2015-07-01','2015-09-30'),'y4q2'=>array('2015-10-01','2015-012-31'),'y4q3'=>array('2016-01-01','2016-03-31'),'y4q4'=>array('2016-04-01','2016-06-30')
,'y5q1'=>array('2016-07-01','2016-09-30'),'y5q2'=>array('2016-10-01','2016-012-31'),'y5q3'=>array('2017-01-01','2017-03-31'),'y5q4'=>array('2017-04-01','2017-06-30')
,'y6q1'=>array('2017-07-01','2017-09-30'),'y6q2'=>array('2017-10-01','2017-012-31'),'y6q3'=>array('2018-01-01','2018-03-31'),'y6q4'=>array('2018-04-01','2018-06-30'));

If the trn_start_date is choosen as Y4Q4 then, the query must count individuals district-wise for each date range as: Y1(Q1-Q4), Y2(Q2-Q4), Y3(Q1-Q4), Y4(Q1-Q4) separately with single query as:

Y1  Y2    Y3    Y4  Y5  Y6
8   3948  3511  0   0   0

AS a solution, I applied following query:

SELECT wi_district.dst_name, 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2017-07-01' AND '2018-06-30' AND 
ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y6 , 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2016-07-01' AND '2017-06-30' AND     ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y5 , 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2015-07-01' AND '2016-06-30' AND ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y4 , 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2014-07-01' AND '2015-06-30' AND ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y3 , 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2013-07-01' AND '2014-06-30' AND ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y2 , 
COUNT(DISTINCT(CASE WHEN wi_training.trn_start_date BETWEEN '2013-02-01' AND '2013-06-30' AND ind_dalit='yes' THEN wi_individual_g.ind_id END)) AS y1 
FROM wi_individual_g 
INNER JOIN wi_individual_p ON wi_individual_p.ind_id=wi_individual_g.ind_id AND wi_individual_g.ind_is_recepient='yes' 
INNER JOIN wi_district ON wi_district.dst_id=wi_individual_g.ind_district_id AND wi_individual_g.ind_deleted=0 
INNER JOIN wi_indv_training ON wi_indv_training.ind_id=wi_individual_g.ind_id AND wi_indv_training.is_deleted=0 
INNER JOIN wi_training ON wi_training.trn_id=wi_indv_training.trn_id AND wi_training.trn_deleted=0 AND wi_training.trn_beneficiary_type=2 AND wi_training.trn_start_date <='2018-06-30' 
GROUP BY wi_district.dst_name

But this query takes more than 5 minutes to execute and that's worst. I also applied the index on fields but achieved somewhat same result. I would be thankful if someone provide me the best solution.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

dongzhent208577 2014-12-11 05:26

关注

I've found the way to increase the performance by 3-times:

At first : the query took around 128 secs
After suggestion: the query took around 78 secs
Further modification: the query took around 23 secs
---------------------------------------------------------------------------------
SELECT d.dst_name,
COUNT(DISTINCT(CASE WHEN a.trn_start_date BETWEEN '2014-07-01' AND '2015-06-30' THEN a.ind_id END)) AS y3 , 
COUNT(DISTINCT(CASE WHEN a.trn_start_date BETWEEN '2013-07-01' AND '2014-06-30' THEN a.ind_id END)) AS y2 , 
COUNT(DISTINCT(CASE WHEN a.trn_start_date BETWEEN '2013-02-01' AND '2013-06-30' THEN a.ind_id END)) AS y1  
FROM 
(
    SELECT g.ind_district_id,g.ind_id,t.trn_start_date,t.trn_beneficiary_type
    FROM wi_individual_g g
    INNER JOIN wi_indv_training wit ON g.ind_id = wit.ind_id AND wit.is_deleted = 0 AND g.ind_deleted=0 AND g.ind_is_recepient='yes'
    INNER JOIN wi_training t ON wit.trn_id = t.trn_id AND t.trn_beneficiary_type=2 AND t.trn_deleted = 0
) a
INNER JOIN wi_individual_p p ON p.ind_id=a.ind_id
INNER JOIN wi_district d ON d.dst_id=a.ind_district_id
WHERE p.ind_dalit='yes'
GROUP BY d.dst_name;

As a whole, the performance has been increased by 6-times from my previous query. Thank you for the suggestion @DRapp

If anyone having best solution to increase the performance, I would like to thank him!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

MYSQL查询优化的问题多条件 in查询 mysql sql
2019-11-11 13:47

回答 2 已采纳 esys_sysusersets表的数据量大概多少？第二次SELECT COUNT(id)的查询确认不是因为缓存才这么快？ esys_dbcontactlogs表注意是否命中索引（select前
mysql 多表 count 查询非常慢如何优化 mysql
2023-01-10 09:50

回答 5 已采纳 1、一个查询SQL慢涉及的方面太多，如数据库运行环境：CPU、内存、网络等等；又如系统设计：业务流程设计、表结构设计（其中包含索引）是否合理等等；再如SQL编写是否契合表的结构及其数据分布等等……2、
mysql 大数据量查询优化 mysql 大数据
2017-11-09 03:01

回答 3 已采纳 http://blog.csdn.net/panjican/article/details/52523410这个里面有相关讲解，看对你是否有帮助
MySQL调优之关联查询、子查询优化
2022-10-31 21:38

流烟默的博客最后，对用于`连接的字段创建索引`，并且该`字段在多张表中的类型必须一致`。比如 course_id 在 student_info 表和 course 表中都为 int(11) 类型，而不能一个为 int 另一个为 varchar 类型。如果
修改SQL语言实现Mysql 多表关联查询优化 mysql sql
2022-07-24 22:34

回答 2 已采纳如果不建立索引的话不管是a表放在左边还是b表放在左边都是一样效果，可以给a表建立一个索引，这样效率可以大大提高，可以参考我的下面的文章https://blog.csdn.net/weixin_4409
MySQL怎么查询可以同时判断多个字段值是否存在 java mysql spring boot
2022-07-21 15:58

回答 3 已采纳先用or把符合条件的全部查出来，然后select case when tel == 手机号 then 1 else 0 end 字段1...，这样就会出现至少一行数据，每行数据里面的字段1可能是1也
MYSQL中如何使用子查询结果作为其中一列展示 mysql 有问必答
2021-04-07 15:11

回答 3 已采纳你这个是纯数据库操作还是说想在前端展示这个效果呢
【大数据系列之MySQL】（二十五）：MySQL中的子查询
2022-12-19 19:55

海洋之心的博客 子查询：出现在其它语句内部的select语句，称为子查询或内查询，就是嵌套的查询结果集。
mysql在order by语句内使用子语句查询的问题 mysql 数据库
2023-03-31 14:15

回答 2 已采纳你可以看下这个问题的回答https://ask.csdn.net/questions/763793这篇博客也不错, 你可以看下MySQL中ORDER BY排序错误除此之外, 这篇博客: 对Mysql数
mysql判断null的查询速度优化 mysql
2022-08-10 15:46

回答 2 已采纳 mysql的null不存储索引，你可以存储对应类型的默认值替换null值存储使其可以被索引加速
关联查询，mysql子查询优化问题 sql
2018-08-30 08:53

回答 5 已采纳分两步处理，第一步，给evaluation_statistical这表的这个两个字段建立索引e.bpjr_id,e.course_id 第二步，不要是用in这个查询，用left join 或者 e
mysql大数据分页查询优化方案
2023-03-30 23:46

莫向光明惰寸功的博客缺点：优点不是很突出，并且子查询结果的id要有正序，否则id>=就不准了。优点：一旦初始化完成，每页都可便捷获取到id，查询速度是极快的。缺点：初始化每页首行id，需要时间较多，还需要缓存起来。适用场景：海量...
Mysql多表查询 #子查询 mysql
2022-06-26 22:40

回答 2 已采纳 子查询是为了从一个查询结果作为另一个查询的条件。或者用对某些字段无法读取的问题，比如分组会导致只能查询分组字段和聚合函数，你这个情况最多算特例
MySQL高级第八篇：关联查询、子查询和排序相关优化
2023-03-27 08:47

Anton丶的博客 子查询是MySQL的一项重要的功能，可以帮助我们通过一个SQL语句实现比较复杂的查询。但是，子查询的执行...在MySQL中，可以使用连接（JOIN）查询来替代子查询。使用子查询可以进行SELECT语句的。大大增加了1O的次数。
MySql 大数据查询优化方案和超大分页的处理方法
2022-02-23 23:14

漠然&&的博客 MySql 大数据查询优化方案优化shema、sql语句+索引第二加缓存、memcached、Redis 主从读复制、读写分离垂直拆分，根据模块耦合度，将一个大的系统分为多个小系统，也就是分布式系统水平切分，针对数据...
没有解决我的问题, 去提问

悬赏问题

¥15 MCNP里如何定义多个源？
¥20 双层网络上信息-疾病传播
¥50 paddlepaddle pinn
¥20 idea运行测试代码报错问题
¥15 网络监控：网络故障告警通知
¥15 django项目运行报编码错误
¥15 请问这个是什么意思？
¥15 STM32驱动继电器
¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏

码龄粉丝数原力等级 --

如何在MySQL中使用子查询优化多个连接的查询

2条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

如何在MySQL中使用子查询优化多个连接的查询

2条回答 默认 最新

悬赏问题

2条回答默认最新