新氧气 2020-12-21 10:34 采纳率: 0%
浏览 460
已结题

一条Hive SQL作业执行慢,该怎么办?

入行大数据两年了,虽然在公司担任大数据开发,无奈公司规模小,没有接触过真正的“大”数据。
面试遇到过这么个问题:有一条Hive SQL,执行了一个半小时,太慢,不符合要求,你该怎么办?
我回答了一些hive 参数调优,包括小文件合并、数据倾斜等参数。我还没回答完,面试官就打断了我,问你如何定位到问题原因?我说可以在UI界面查看是否发生数据倾斜。面试官接着说,好,现在知道发生数据倾斜了,你如何定位到是哪个地方发生了数据倾斜?我......。面试官看我窘迫,接着说,假设不是数据倾斜,你接下来怎么办?我......
针对这个问题,有没有什么思考模式或者方法论?

  • 写回答

1条回答 默认 最新

  • SoftwareTeacher 《编程之美》作者 2020-12-21 13:36
    关注
    评论

报告相同问题?

悬赏问题

  • ¥30 arduino vector defined in discarded section `.text' of wiring.c.o (symbol from plugin)
  • ¥20 关于#c++#的问题:(2)运算二叉树·表达式一般由一个运算符和两个操作数组成:(相关搜索:二叉树遍历)
  • ¥20 如何训练大模型在复杂因素组成的系统中求得最优解
  • ¥15 关于#r语言#的问题:在进行倾向性评分匹配时,使用“match it"包提示”错误于eval(family$initialize): y值必需满足0 <= y <= 1“请问在进行PSM时
  • ¥45 求17位带符号原码乘法器verilog代码
  • ¥20 PySide6扩展QLable实现Word一样的图片裁剪框
  • ¥15 matlab数据降噪处理,提高数据的可信度,确保峰值信号的不损失?
  • ¥15 怎么看我在bios每次修改的日志
  • ¥15 python+mysql图书管理系统
  • ¥15 Questasim Error: (vcom-13)