大白话西游 2022-03-27 10:00 采纳率: 100%
浏览 101
已结题

Hive的MR引擎或者Tez引擎中reduce的数量到底是由什么决定的?

理论上来说,不是说一种key对应一个reduce吗,但是为什么我这样跑一个任务,对应的key应该是data_dt吧,但是data_dt也没有1000多个呀,为什么有1000多个reduce呢?

img

  • 写回答

2条回答 默认 最新

  • ❀lee 2022-03-27 10:52
    关注

    可以设置reduce的参数的
    set mapreduce.reduce.tasks
    可以直接设置有多少个task

    如果没有指定reduce个数,
    通过hive.exec.reduces.bytes.per.reducer参数来设定每个reducer处理的bytes。
    这个参数越大,reducer就越少。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月4日
  • 已采纳回答 3月27日
  • 创建了问题 3月27日

悬赏问题

  • ¥15 高通安卓11提取完整线刷包软件,或者优博讯dt50顺丰刷机包
  • ¥20 C,有个译码器,换了信道就跑不出原来数据
  • ¥15 MIMIC数据库安装问题
  • ¥60 基于JTag协议开发Fpga下载器上位机,哪位大🐂有偿指导?
  • ¥20 全书网Java爬取数据
  • ¥15 怎么获取红包封面的原始链接,并且获取红包封面序列号
  • ¥100 微信小程序跑脚本授权的问题
  • ¥100 房产抖音小程序苹果搜不到安卓可以付费悬赏
  • ¥15 STM32串口接收问题
  • ¥15 腾讯IOA系统怎么在文件夹里修改办公网络的连接