沧海寄馀生 2021-09-06 09:53 采纳率: 0%
浏览 102
已结题

hive on mr 产生了空文件(hivesql)

已设置参数
hive.merge.mapredfiles=true; mr任务
hive.merge.mapfiles=true only map
set hive.merge.smallfiles.avgsize=16M 输出文件平均大小小于16M会自动合并
set hive.merge.size.per.task=256M 合并后所需的文件大小
hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat

测试参数:
set hive.merge.smallfiles.avgsize=3; 默认16M
set mapred.min.split.size.per.node=1; 集群默认参数
set mapred.max.split.size=3; 默认256M
set mapred.min.split.size.per.rack=1; 集群默认参数
set hive.merge.size.per.task=3; 默认256M

比如当没有匹配一条数据时候 执行hivesql mr程序
create table test_data_source_insert_cr10 as select * from test_data_source_insert where name like 'kkk';
结果:
[root@bigdataxxxx ~]# hdfs dfs -ls /user/hive/warehouse/wqg.db/test_data_source_insert_cr10
Found 4 items
-rwxrwx--x+ 3 hive hive 0 2021-09-02 11:13 /user/hive/warehouse/wqg.db/test_data_source_insert_cr10/000000_0
-rwxrwx--x+ 3 hive hive 0 2021-09-02 11:13 /user/hive/warehouse/wqg.db/test_data_source_insert_cr10/000001_0
-rwxrwx--x+ 3 hive hive 0 2021-09-02 11:13 /user/hive/warehouse/wqg.db/test_data_source_insert_cr10/000002_0
-rwxrwx--x+ 3 hive hive 0 2021-09-02 11:13 /user/hive/warehouse/wqg.db/test_data_source_insert_cr10/000003_0

产生了4个空文件 合并的参数没有起到效果 请问如何解决?

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-09-08 10:13
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 9月14日
  • 创建了问题 9月6日

悬赏问题

  • ¥15 镍氢电池充电器设计实物使用原理
  • ¥15 逻辑谓词和消解原理的运用
  • ¥15 三菱伺服电机按启动按钮有使能但不动作
  • ¥15 js,页面2返回页面1时定位进入的设备
  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号