hive 163个问题
2018.06.20 17:59来自 u011856283 悬赏 5C
[HIVE]中的insert into操作为什么非常慢
例如如下语句 ``` insert into table1 partition(xxx=xxx) select * from table2 ``` 即使数据只有两三条,也要2分钟,这是为什么?
6

回答

2018.06.19 11:32来自 u011856283 悬赏 5C
【hive】SQL问题,4表联查怎么优化,语句太长了
我的数据库是hive,但实际操作是用sql操作的,所以想问怎么优化sql,因为实在是太长了,头说不行 但是我的操作要使用3张数据表和一张字典表 因为sql有点长(大概60多行),发出来大家估计也看不明白,主要问...
5

回答

2018.06.19 09:09来自 u011856283 悬赏 5C
hive中字符串类型的日期为什么能够进行比较?
``` where import_date_day >= '2018-06-08' and import_date_day <= '2018-06-14' ``` 例如上面的这种,我的字段da...
5

回答

2018.06.13 14:26来自 u011856283 悬赏 5C
[HDFS]hive表文件下的.metadata文件夹是什么?
我生成avro或者parquet文件的时候,会有.metadata文件夹在hive表文件中,但是textfile类型的表就没有, 在或者我从textfile表数据insert到parquet表的时候,parquet...
1

回答

2018.06.05 13:26来自 SunnyYoona 悬赏 5C
hive SERDEPROPERTIES 实现正则过滤
Hive 创建表的时候指定正则 不符合正则的过滤而不是NULL ``` ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' ...
1

回答

2018.06.04 16:33来自 ldy414 悬赏 5C
hive怎么实现类似于python的range(n,m)功能
比如字段为 uid , 2,10 变成 uid,2 uid,3 uid,4 uid,5 uid,6 uid,7 uid,8 uid,9 uid10 实际上比这个复杂,所以不要用join辅助列来完成,最好是有什么...
3

回答

2018.05.31 09:35来自 u011856283 悬赏 5C
急】hive,insert从parquet表插入到textfile(cvs)表时,字段内容为NULL
我有两张表,字段数量名字相同 A表示parquet表 B表是textfile表,放cvs数据的按tab分割 现在A表有10条数据,B表无数据,我想使用insert overwrite A到B,然后insert完毕...
2

回答

2018.04.24 18:01来自 u011856283 悬赏 5C
【大数据】请问impala怎么用命令行连接?提示找不到命令
这样,我在集群上向连接impala试试,然后输入 impala-shell 命令找不到,我看了没有配置在profile里面,但是linux机器上有impala的文件目录,请问这个命令在那个文件夹下存放这? 主要是...
2

回答

2018.04.16 08:37来自 u011856283 悬赏 5C
【急】hive表数据太多,普通的查询语句都用不了,求解决【应该很简单】
之前做项目用的hive,本来功能什么的都好了,但是测试的时候不知道王里面加了多少数据,可能有5000W条,一张表。 然后我现在用select * from tablename,或者select count(1) f...
6

回答

2018.04.13 17:50来自 u011856283 悬赏 5C
hive使用load导入csv文件,怎么自动创建分区?
数据表格式如下 name,year,month,day 4个字段,后三个是分区字段 然后现有一csv文件内容为 jamie,1996,04,10 hims,1995,05,17 kash,1997,12,11 ...
3

回答

共163条数据 1 3 4 ... 尾页