sbymdh2003 2023-02-15 10:38 采纳率: 0%
浏览 54

row_number()性能优化

我有一张表,亿级,字段有20个左右。数据里面一个ID会有多种类型,每个类型都有对应多个的时间。使用过程中除了全表数据都在使用外,还有一些特殊情况需要取每个ID中每个类型的第一次出现情况。我是用的row_number()over(partition by id,类型 order by create_time) As rn生成一个序号,再根据序号去实现功能。
加上row_number后性能就很差,请问有什么好的解决办法?

谢谢!

  • 写回答

3条回答 默认 最新

  • Hub-Link 2023-02-15 10:47
    关注

    对于你这个取每个ID中每个类型的第一次出现情况需求,基本都是需要有一次排序的,
    你看能不能在取特殊ID的时候你看能不能过滤一些数据,
    比如你的特殊ID都在某个时间之后那就可以过滤时间,或者在都在某些特定的分区里面那就过滤出需要的分区

    评论

报告相同问题?

问题事件

  • 创建了问题 2月15日

悬赏问题

  • ¥20 python忆阻器数字识别
  • ¥15 无法输出helloworld
  • ¥15 高通uboot 打印ubi init err 22
  • ¥20 PDF元数据中的XMP媒体管理属性
  • ¥15 R语言中lasso回归报错
  • ¥15 网站突然不能访问了,上午还好好的
  • ¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
  • ¥15 semrush,SEO,内嵌网站,api
  • ¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
  • ¥15 振荡电路,ADS仿真