大白话西游 2022-03-27 10:00 采纳率: 100%
浏览 97
已结题

Hive的MR引擎或者Tez引擎中reduce的数量到底是由什么决定的?

理论上来说,不是说一种key对应一个reduce吗,但是为什么我这样跑一个任务,对应的key应该是data_dt吧,但是data_dt也没有1000多个呀,为什么有1000多个reduce呢?

img

  • 写回答

2条回答 默认 最新

  • 数仓白菜白 2022-03-27 10:52
    关注

    可以设置reduce的参数的
    set mapreduce.reduce.tasks
    可以直接设置有多少个task

    如果没有指定reduce个数,
    通过hive.exec.reduces.bytes.per.reducer参数来设定每个reducer处理的bytes。
    这个参数越大,reducer就越少。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月4日
  • 已采纳回答 3月27日
  • 创建了问题 3月27日

悬赏问题

  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突