两个表关联查询,一旦用了between 或 >= , or这些关键词,查询时间从0.05秒直接到了17秒
不知道如何对SQL进行优化
站点表 一共1500条数据
表t_bas_station_state
position_name varchar 站点名称
station_code varchar 站点编号
数据表 600W条数据
TimePoint timestamp 数据时间
stationCode varchar 站点编号
aqi varchar 业务数据
这是这个表的索引
select
tbss.position_name ,
tbss.station_code ,
tehss.TimePoint ,
tehss.AQI
from
t_bas_station_state tbss
JOIN t_env_hourdata_station_state tehss ON TimePoint = '2020-05-15 16' AND tbss.station_code = tehss.StationCode
查询时间 0.02秒 输出1470条数据
select
tbss.position_name ,
tbss.station_code ,
tehss.TimePoint ,
tehss.AQI
from
t_bas_station_state tbss
JOIN tehss on tbss.station_code = tehss.StationCode and
tehss.TimePoint >= '2020-05-15 21'
and tehss.TimePoint <= '2020-05-16 00'
查询时间 18.03秒 输出5880条数据
上面的语句是只查单个小时的,下面的语句是查询4个小时的,不知道怎样优化
select * from t_env_hourdata_station_state where
TimePoint >= '2020-05-15 21'
and TimePoint <= '2020-05-16 00'
如果不进行两表关联,单独用范围查询,查询时间0.084秒 5988条记录
这是对慢的SQL进行explain
还有一个不知道有没有用的信息
SELECT
tbss.position_name,
tbss.station_code,
tehss.TimePoint,
tehss.AQI
FROM
( SELECT StationCode, TimePoint, AQI FROM t_env_hourdata_station_state WHERE TimePoint >= '2020-05-15 21' AND TimePoint <= '2020-05-16 00' ) tehss
LEFT JOIN t_bas_station_state tbss ON tbss.station_code = tehss.StationCode
我用数据表左连接站点表,1.068s输出5988条数据,这个结果不是我要的结果,有一些数据没有关联站点需要剔除,我如果再加上 Where tbss.station_code is not null 的话,时间又回到17s左右了
问题解决了
使用force index(datatime) 强制执行索引 执行时间0.8秒