[HIVE]执行HQL的group by操作报Job status not available错误

在公司测试集群上测试hive查询

情况如下：
正常使用查询语句等其他基本语句，没问题，例如

 select * from tablename；// 正常

但是需求中有操作需要分组，需要使用group by操作

 select name from tablename group by name； // 报错

使用java操作和使用beeline操作报同样的错误，执行语句的时候明显感觉到已经执行了，但是最后无法返回结果，报错，完整错误如下

 Error: org.apache.hive.service.cli.HiveSQLException: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask. Job status not available 
    at org.apache.hive.service.cli.operation.Operation.toSQLException(Operation.java:380)
    at org.apache.hive.service.cli.operation.SQLOperation.runQuery(SQLOperation.java:257)
    at org.apache.hive.service.cli.operation.SQLOperation.access$800(SQLOperation.java:91)
    at org.apache.hive.service.cli.operation.SQLOperation$BackgroundWork$1.run(SQLOperation.java:348)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1754)
    at org.apache.hive.service.cli.operation.SQLOperation$BackgroundWork.run(SQLOperation.java:362)
    at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
    at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)
Caused by: java.io.IOException: Job status not available 
    at org.apache.hadoop.mapreduce.Job.updateStatus(Job.java:331)
    at org.apache.hadoop.mapreduce.Job.getJobState(Job.java:352)
    at org.apache.hadoop.mapred.JobClient$NetworkedJob.getJobState(JobClient.java:300)
    at org.apache.hadoop.hive.ql.exec.mr.HadoopJobExecHelper.progress(HadoopJobExecHelper.java:251)
    at org.apache.hadoop.hive.ql.exec.mr.HadoopJobExecHelper.progress(HadoopJobExecHelper.java:559)
    at org.apache.hadoop.hive.ql.exec.mr.ExecDriver.execute(ExecDriver.java:424)
    at org.apache.hadoop.hive.ql.exec.mr.MapRedTask.execute(MapRedTask.java:151)
    at org.apache.hadoop.hive.ql.exec.Task.executeTask(Task.java:199)
    at org.apache.hadoop.hive.ql.exec.TaskRunner.runSequential(TaskRunner.java:100)
    at org.apache.hadoop.hive.ql.Driver.launchTask(Driver.java:2183)
    at org.apache.hadoop.hive.ql.Driver.execute(Driver.java:1839)
    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1526)
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1237)
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1232)
    at org.apache.hive.service.cli.operation.SQLOperation.runQuery(SQLOperation.java:255)
    ... 11 more (state=08S01,code=1)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
疯子要来了 2018-04-11 09:42
关注
须配置Job History Server相关参数，让Job Client可以读取job最后的执行状态，测试Hadoop版本2.5.0
添加参数vim mapred-site.xml

mapreduce.jobhistory.address
master.hadoop:10020

yarn.app.mapreduce.am.staging-dir
/tmp/hadoop-yarn/staging

mapreduce.jobhistory.intermediate-done-dir
${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate

mapreduce.jobhistory.done-dir
${yarn.app.mapreduce.am.staging-dir}/history/done

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问大家为什么我连接hive无法执行插入语句呀 hive 大数据数据库
2023-03-14 10:08

回答 1 已采纳 job的执行错误，看下你的脚本代码，去掉可能出错的部分再试试看
hql语句的优化,广告方面的计算 hive hql 数据库 hive sql 大数据有问必答
2022-03-23 14:40

回答 3 已采纳首先，你这个代码本身应该存在问题，t1/t2/t3输出的数据不止一行，因为有"group by ADS_CODe"，但你并没有写任何关联条件，这样会导致产生笛卡尔积，数据结果记录翻倍。然后，要优化这个
hive脚本把exists或not exist改成inner join或left join hive sql 大数据
2022-04-29 16:15

回答 1 已采纳 SELECT T.*, '个人客户' ERROR_TWO_TYPE FROM (SELECT * FROM SRBZ_HIVE.TMP_YWJH_ZQZRR_GR_
大数据之hive 阿善看到
2020-11-01 22:57

okbin1991的博客第1章Hive基本概念 1.1什么是Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL...
关于hive上NOT IN改为左连接left join hive sql 大数据
2022-04-28 23:51

回答 1 已采纳 DROP TABLE IF EXISTS TMP_YWJH_YKDZ_04;CREATE TABLE TMP_YWJH_YKDZ_04 ASSELECT A.*, B.LNX_NUM LNX_NUMF
hive中group by条件加了一条导致count（*）变多，有什么办法吗？ hive mysql sql 有问必答
2021-08-31 12:03

回答 2 已采纳 select pt_d,prodname,count(*) as 会员数,sum(price)/count(1) as 价格 From X group by pt_d,prodname
hive的执行顺序是什么 hive
2022-12-25 22:27

回答 2 已采纳 Hive 的执行顺序一般如下:语法检查: 在执行 Hive 查询之前, Hive 会对查询进行语法检查, 以确保查询的语法是正确的.解析: 在语法检查通过后, Hive 会解析查询, 将其转换为内部的
Hadoop 大数据生态框架--Hive
2021-10-12 21:15

Lowrance_TT的博客 1. Hive 入门 1.1 什么是 Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成...
hive执行map reduce任务失败 hive
2022-06-08 01:28

回答 2 已采纳 1 可能是你没登录成功2 查询语句需要写库名.表名，不然找不到
hive hql 数据库近 7天 30天的点击,展示点击率这个广告方面的 hive sql 数据仓库
2022-03-24 15:57

回答 1 已采纳将每天的分子和分母分别求和，最后再除，这个是没问题的。但是并不清楚你问题卡在哪里了，如果你只想算7天的，直接加个where条件过滤一下数据不就行了？ select min(create_time )
hive脚本中NOT EXISTS改为左连接left join hive sql 数据库
2022-04-29 11:33

回答 1 已采纳 SELECT A.*, ERROR_TWO_TYPEFROM SRBZ_HIVE.TMP_YWJH_ZQZRR_DW_02 Aleft join DIC_INT.INT_ODS_USER_AGENT_
Hive实战
2021-06-21 11:57

大数据翻身的博客一、Hive 概述 1.1 Hive 是什么由Facebook开源用于解决海量结构化日志的数据统计基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射成一张表，并且提供类SQL的查询功能 Hive仅仅是一个工具，本身不...
hive怎么拼接单引号 hive sql 大数据
2022-08-02 12:01

回答 7 已采纳不能用拼接，拼接之后用不了in，in是判断左边的字段是否在右边内容(集合)中，拼接的是一个字符串整体，不是集合。 SELECT sku_key,warehouse_key,SUM(quantity)
大数据技术之Hive
2019-09-26 22:06

鞋子不会飞的博客 大数据技术之Hive 第1章 Hive入门 1.1 什么是Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质...
1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解
2023-06-05 11:00

一瓢一瓢的饮 alanchanchn的博客 Apache Hive是一款建立在Hadoop之上的开源数据仓库系统，可以将存储在Hadoop文件中的结构化、半结构化数据文件...Hive核心是将HQL转换为MapReduce程序，然后将程序提交到Hadoop群集执行。Hive由Facebook实现并开源。
没有解决我的问题, 去提问

悬赏问题

¥15 Python时间序列如何拟合疏系数模型
¥15 求学软件的前人们指明方向🥺
¥50 如何增强飞上天的树莓派的热点信号强度，以使得笔记本可以在地面实现远程桌面连接
¥20 双层网络上信息-疾病传播
¥50 paddlepaddle pinn
¥20 idea运行测试代码报错问题
¥15 网络监控：网络故障告警通知
¥15 django项目运行报编码错误
¥15 STM32驱动继电器
¥15 Windows server update services

[HIVE]执行HQL的group by操作报Job status not available错误

2条回答 默认 最新

悬赏问题

2条回答默认最新