关于#hive#的问题：插入数据时没有报错但是map和reduce都为0，数据没有被读入和写入，最后查询时依然没有查询到所插入的数据

请求回答，插入数据时没有报错但是map和reduce都为0，数据没有被读入和写入，最后查询时依然没有查询到所插入的数据。
这种情况该怎么解决啊？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-17 22:24
关注
引自免费微信小程序：皆我百晓生

面对你在Hive中遇到的问题，即数据插入后在执行查询时仍然找不到数据，且MapReduce任务数为0，这通常可能由于以下几个原因导致：

表不存在：确认表是否已经创建，并且是在正确的数据库（默认是default）中。
数据格式不匹配：检查插入的数据类型与表结构中的字段类型是否一致。
执行权限：确保当前用户对表有写入权限。
Hive配置：确认Hive的执行引擎设置正确（例如，Spark、Tez等），并且这些服务已启动。

为了排查并解决这个问题，可以按照以下步骤操作：

**步骤一：**首先确认表是否存在以及其结构：

DESCRIBE FORMATTED default.stu;

如果表不存在，你需要先创建表：

CREATE TABLE IF NOT EXISTS default.stu ( id INT, name STRING );

**步骤二：**检查插入的数据是否符合表结构的要求。例如，如果表中有id(int)和name(string)两个字段，那么插入的数据应为(1, "a")这样的格式。

INSERT INTO default.stu VALUES (1, "a");

**步骤三：**确认是否有足够的权限进行写入操作。如果你不是管理员，可以尝试使用GRANT命令赋予相应的权限。

GRANT ALL PRIVILEGES ON TABLE default.stu TO [your_username];

**步骤四：**确认Hive的执行引擎设置。Hive默认使用的是Hive on MR，但这个已经被弃用。你可以通过以下命令查看当前的执行引擎：

SET mapred.job.tracker;

如果输出结果是local, 那么说明正在使用本地模式。要切换到其他执行引擎（如Spark），你需要在Hive的配置文件（通常是hive-site.xml）中更改hive.execution.engine属性。如果你的集群启用了Spark，可以在Hive客户端运行以下命令：

SET hive.exec.mode=spark; -- 设置为Spark执行引擎

**步骤五：**重启Hive服务，让新的配置生效。然后再次尝试插入数据并查询。

如果你的集群启用了YARN，确保HiveServer2服务已经启动。你可以通过以下命令检查：

jps | grep HiveServer2

如果没有返回任何结果，启动HiveServer2：

sbin/start-hiveserver2.sh

如果你的集群启用了Kerberos，确保你已经登录了Kerberos并设置了适当的环境变量。

执行上述步骤后，你应该能成功插入数据并能在查询中找到它。如果还有问题，请提供更详细的错误信息以便进一步诊断。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hive的数据倾斜解决（Map端、reduce 端、join中）
2020-11-02 15:24

lianchaozhao的博客 hive 的数据倾斜一般我们可以分为 Map倾斜、reduce 倾斜和join 倾斜这几种。
高效数据处理：MapReduce与Hive的实战应用
2024-10-07 16:32

南瓜呱呱的博客 mapreduce数据预处理及hive分析汇总【全国大数据比赛省赛赛题--mapreduce数据预处理及hive分析汇总】
13-Hive的基本操作和查询语法以及案例
2022-06-26 23:41

大数据下的画像人的博客 13-Hive的基本操作和查询语法以及案例
apache atlas mysql_apache atlas使用import-hive.sh导入hive历史元数据后没有lineage，并且报错...
2021-01-26 15:24

weixin_39838328的博客使得结构化数据与Hadoop之间的导入导出变得容易可以导入整个库或者单个表可以与Oozie集成，将导入导出作为工作流的一部分。内部转化为MapReduce，用于传输数据下载安装配置根据Hadoop版本选择对应的Sqoop，我这里是...
关于 Hive 的必知必会
2024-12-27 11:30

沙滩de流沙的博客拉链表有数据的开始日期和结束日期，记录着数据的生命周期。拉链表通过增量表进行不断的更新。下面就是一张拉链表，存储的是用户购买商品的基本信息，另外也记录了每条订单的生命周期。下图展示订单号为1 的记录生命...
Spark 批计算数据流转过程和计算过程详解
2025-12-02 15:00

光子AI的博客特性Sort Merge Join (默认)核心思想哈希查找排序合并Shuffle必然发生必然发生内存压力高，需在内存中构建哈希表低，流式归并，可溢写磁盘适用场景小表join大表，且小表分区可装入内存两个大规模数据集的通用join...
Hive的基本操作和数据类型
2019-05-24 00:20

趣学程序-shaofeer的博客 Hive的基本操作 1.启动Hive bin/hive 2.查看数据库 hive>show databases; 3. 打开默认数据库 hive>use default; 4.显示default数据库中的所有表 hive>show tables; 5.创建一张表 hive> ...
大数据-数据仓库-Hive总结及性能优化
2020-03-02 23:11

ckSpark的博客 Hive是构建在Hadoop之上的数据仓库软件。它提供类似sql的查询语句HiveQL对数据进行分析处理，Hive将HiveQL语句转换成一系列MapReduce作业并执行。
五、Hive数据仓库（完整版）
2021-03-13 13:52

章鱼哥TuNan&Z的博客数据仓库顾名思义，**是一个很大的数据存储集合，出于企业的分析性报告和决策支持目的而创建，对多样的业务数据进行筛选与整合。**它为企业提供一定的BI（商业智能）能力，指导业务流程改进、监视时间、成本、质量...
Hive第一天：Hive入门、优缺点、Hive架构原理、Hive下载安装、Hive元数据配置MySQL、Hive常用命令、Hive属性配置、Hive数据类型、DDL数据定义、Hive对数据库的增删改查
2019-08-25 23:41

DougLeaMrConcurrency的博客 1.4Hive 和数据库比较。 1.4.1查询语言。 1.4.2数据存储位置。 1.4.3数据更新。 1.4.4索引 1.4.5执行。 1.4.6执行延迟。 1.4.7可扩展性。 1.4.8数据规模。第2章Hive安装 2.1Hive 安装地址。 2.2...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月17日

关于#hive#的问题：插入数据时没有报错但是map和reduce都为0，数据没有被读入和写入，最后查询时依然没有查询到所插入的数据

5条回答 默认 最新

问题事件

5条回答默认最新