weixin_59697165 2022-03-29 15:42 采纳率: 0%
浏览 20

HIVESQL数据排序问题

今天面试被问到一个问题,hive数仓中,原表数据量很大,无法全局排序的情况下,如何取出金额最大的十条?

  • 写回答

1条回答 默认 最新

  • DarkAthena ORACLE应用及数据库设计方案咨询师 2022-03-29 18:39
    关注
    1. 如果不要求数据绝对精准,hive中有一些近似查询函数,带有approx前缀或者后缀,可以朝这个方向考虑
    2. "无法全局排序",但他没说是不是可以分片排序。比如,可以把原数据拆成N份,每份分别进行排序,每份都取前10条,获得10N条的记录,然后再针对这10N条的数据排序取前十。
    评论

报告相同问题?

问题事件

  • 创建了问题 3月29日

悬赏问题

  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 LiBeAs的带隙等于0.997eV,计算阴离子的N和P
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 来真人,不要ai!matlab有关常微分方程的问题求解决,
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算