【急】hive表数据太多，普通的查询语句都用不了，求解决【应该很简单】

之前做项目用的hive，本来功能什么的都好了，但是测试的时候不知道王里面加了多少数据，可能有5000W条，一张表。
然后我现在用select * from tablename，或者select count（1） from tablename，根本就没有反映，一直在loding

用select * from tablename limit 1，1，就可以出来结果

请问这是杂回事情，怎么优化？是不是内存不足？？？
求帮忙，今天我一定得解决这个问题阿

我是用java 的jdbc来操作的，换到beeline上执行也是一样，一直loading

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qdf_csdn 2018-04-16 06:58
关注
select *是将所有数据load到内存，5000万数据量还是比较大的，加载到内存都是一个比较漫长的过程了。你可以试一下在该表建分区。查询的时候建议指定分区，或者像select * from tablename limit 1，1这样做分页，并且建议用where条件过滤出需要的数据（如果有过滤条件的情况下），尽量避免全表查询。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

【急】hive表数据太多，普通的查询语句都用不了，求解决【应该很简单】 hadoop hive java 大数据数据库
2018-04-16 00:37

回答 4 已采纳 `select * `是将所有数据load到内存，5000万数据量还是比较大的，加载到内存都是一个比较漫长的过程了。你可以试一下在该表建分区。查询的时候建议指定分区，或者像`select * from
hive用select*from查看不到表数据 centos hadoop hive
2022-03-17 20:47

回答 1 已采纳参考一下这篇文章 hive表删除分区后，重新插入，查询不到数据问题_雾岛与鲸的博客-CSDN博客_hive 重新分区 1、选择一张分区表（本
救命，hive中使用insert into 不能插入数据，别的语句都行，求解（着急） hadoop hive java
2018-03-12 05:34

回答 2 已采纳你有abc这张表吗，我看你的图片好像没有
【大数据Hive】hive 多字段分隔符使用详解
2024-03-03 13:12

逆风飞翔的小叔的博客 hive 多字段分隔符使用详解
为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样 hive spark sql 有问必答
2022-03-27 14:34

回答 2 已采纳把情景一改成这样试试spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume,
大数据hive分区表导入数据的问题 hive 大数据
2018-01-07 12:34

回答 5 已采纳 http://blog.csdn.net/fjssharpsword/article/details/64919412
hive查询，使用where子查询没有返回结果 hive 大数据
2021-12-18 21:13

回答 1 已采纳 where中又使用了一次emloyees表,和上面的emloyees表没有任何关联关系,你要根据80000.0来定位数据的话,应该是像下面这样写 select name, salary, deduct
【大数据Hive】hive 加载数据常用方案使用详解
2023-09-05 19:00

逆风飞翔的小叔的博客 hive 加载数据常用方案使用详解
hive创建外部表导入csv数据格式出错 hadoop hive 大数据
2022-06-06 17:18

回答 2 已采纳在window用excel把csv改成\t 分割,建表分割符改成\t
hive数据表array类型列导入数据为空 hive 有问必答
2022-02-26 20:05

回答 3 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
请问大家为什么我连接hive无法执行插入语句呀 hive 大数据数据库
2023-03-14 10:08

回答 1 已采纳 job的执行错误，看下你的脚本代码，去掉可能出错的部分再试试看
【大数据】Hive 中的批量数据导入
2023-08-23 23:58

G皮T的博客在前面的博客中，我简单介绍了几种向 Hive 表中插入数据的方法。然而更多的时候，我们并不是一条数据一条数据的插入，而是以批量导入的方式。在本文中，我将全面介绍几种向 Hive 中批量导入数据的方法。
hive分区表数据备份到HDFS hive 有问必答
2021-08-02 14:12

回答 1 已采纳有了有了，谢谢大家，是我自己疏忽了。导入HDFS本地文件系统也是需要加local的，我以为本地文件系统是计算机文件系统正确代码:insert overwrite local directory。一定要
大数据Hive Join连接查询
2021-09-19 11:38

赵广陆的博客目录1 join概念回顾2 Hive join语法2.1 规则树2.2 语法丰富3 join查询数据环境准备4 Hive inner join5 Hive left join6 Hive right join7 Hive full outer join9 Hive cross join10 Hive join使用注意事项 ...
【大数据Hive】hive select 语法使用详解
2023-10-14 09:37

逆风飞翔的小叔的博客 hive 查询语法使用详解
没有解决我的问题, 去提问

悬赏问题

¥15 STM32单片机自主设计
¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
¥15 不小心不正规的开发公司导致不给我们y码，
¥15 我的代码无法在vc++中运行呀，错误很多
¥50 求一个win系统下运行的可自动抓取arm64架构deb安装包和其依赖包的软件。
¥60 fail to initialize keyboard hotkeys through kernel.0000000000
¥30 ppOCRLabel导出识别结果失败
¥15 Centos7 / PETGEM
¥15 csmar数据进行spss描述性统计分析
¥15 各位请问平行检验趋势图这样要怎么调整？说标准差差异太大了

【急】hive表数据太多，普通的查询语句都用不了，求解决【应该很简单】

4条回答 默认 最新

悬赏问题

4条回答默认最新