Hive的MR引擎或者Tez引擎中reduce的数量到底是由什么决定的？

理论上来说，不是说一种key对应一个reduce吗，但是为什么我这样跑一个任务，对应的key应该是data_dt吧，但是data_dt也没有1000多个呀，为什么有1000多个reduce呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
❀lee 2022-03-27 10:52
关注
可以设置reduce的参数的
set mapreduce.reduce.tasks
可以直接设置有多少个task

如果没有指定reduce个数，
通过hive.exec.reduces.bytes.per.reducer参数来设定每个reducer处理的bytes。
这个参数越大，reducer就越少。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Hive中MR（MapReduce）、Tez和Spark执行引擎对比
2024-08-01 08:58

秦JaccLink的博客 Hive是基于Hadoop的数据仓库工具，提供了一种SQL-like的查询语言（HiveQL），用于对存储在Hadoop分布式文件系统（HDFS）中的数据进行分析。Hive将用户的查询转换为底层的执行计划，并通过不同的执行引擎进行处理。...
spark或mr引擎插入的数据，hive表查询数据为0
2024-02-28 15:20

### Spark或MR引擎插入的数据，Hive表查询数据为0的问题解析 #### 问题背景与现象在大数据处理场景中，经常会遇到使用不同执行引擎（如Spark、MapReduce (MR) 或 Tez）进行数据处理的情况。其中一种常见的问题是...
Hive_引擎MR、Tez、Spark
2021-08-20 14:28

大数据翻身的博客 Hive引擎包括：默认MR、Tez、Spark 不更换引擎hive默认的是MR。 Hive on Spark：Hive既作为存储元数据又负责SQL的解析优化，语法是HQL语法，执行引擎变成了Spark，Spark负责采用RDD执行。 Spark on Hive : Hive只...
Hive 基于Tez引擎 map和reduce数的参数控制原理与调优经验
2022-03-25 21:06

abcdggggggg的博客 Hive on Tez的引擎调优基于Map数和Reduce数的调优
Hive mapreduce的map与reduce个数由什么决定？
2020-07-25 16:33

黄土高坡上的独孤前辈的博客文章目录1.MapTask的数量决定2....3. ReduceTask的数量决定3.1 在执行hive shell的时候可以看到下列日志3.2 官网对这三个参数的解释3.3 通过源码分析 hive是如何通过方式一动态计算reduce的个数的4.如何
Hive 基于常用参数的调优（Tez和MR引擎）
2021-10-30 10:09

abcdggggggg的博客 Hive的常用计算引擎有MR、Tez和Spark，本篇博客主要是基于MR和Tez的参数调优，由于Hive的任务是在Yarn上提交的，所以Yarn作为一个资源调度器，可用的资源也需要进行配置。 2.Yarn参数个性化配置配置文件名：...
Hive的安装及集成Tez为执行引擎
2023-11-29 15:11

只会hello world的程序员的博客切换Tez执行引擎后，hive启动以及HQL执行的日志较多，可参考前面第11步，将日志打印级别设为WARN或者ERROR。Tez介绍：https://www.infoq.cn/article/apache-tez-saha-murthy。3、hive.cli.tez.session.async：是否...
用Tez替换MR作为Hive的计算引擎
2019-08-24 21:30

君积行的博客用Tez替换MR作为Hive的计算引擎一、安装包准备（1）下载tez的依赖包：http://tez.apache.org2）（2）解压安装包apache-tez-0.9.1-bin.tar.gz 二、在Hive中配置Tez （1）进入到Hive的配置目录：/opt/module/...
Hive计算引擎Tez简介和使用
2020-10-25 16:46

GOD_WAR的博客用Hive直接编写MR程序，假设有四个有依赖关系的MR作业，上图中，绿色是Reduce Task，云状表示写屏蔽，需要将中间结果持久化写到HDFS。 Tez可以将多个有依赖的作业转换为一个作业，这样只需写一次HDFS，且中间节点较...
设置hive执行引擎为Tez
2019-10-20 16:39

尘客.的博客我们知道hive默认计算引擎为MR，而MR的特性决定了它的运算速度并不是太让人满意。在此将其运算引擎修改为Tez（当然在此需要先安装Tez），Tez基于内存的计算使得hive可以有更高的运算效率。安装配置如下：在此假设...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

Hive的MR引擎或者Tez引擎中reduce的数量到底是由什么决定的？

2条回答 默认 最新

问题事件

2条回答默认最新