hive数据批量导入hbase过程中遇到分区文件不存在异常

在做一个hive数据批量导入hbase的方法，根据官方文档一步一步的做下来，但是在生成HFILE文件时却报了一个比较让人纠结的错误，在网上找了很长时间，都木有合适的答案，在hive命令行中执行的代码如下：
SET mapred.reduce.tasks=5;
SET hive.mapred.partitioner=org.apache.hadoop.mapred.lib.TotalOrderPartitioner;
SET total.order.partitioner.path=/ws/hbasetest/hbase_splits;
INSERT OVERWRITE TABLE hbase_hfiles SELECT * FROM pgc CLUSTER BY rowkey;

然后报了如下异常：
Error: java.lang.IllegalArgumentException: Can't read partitions file

    at org.apache.hadoop.mapreduce.lib.partition.TotalOrderPartitioner.setConf(TotalOrderPartitioner.java:116)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:73)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:133)
    at org.apache.hadoop.mapred.MapTask$OldOutputCollector.<init>(MapTask.java:569)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:430)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:342)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:168)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1548)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:163)
Caused by: java.io.FileNotFoundException: File file:/inm/app/cdh5/cdhworkspace/yarn/local/usercache/hadoop/appcache/application_1397722576517_0053/container_1397722576517_0053_01_000005/_partition.lst does not exist
at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:511)
at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:724)
at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:501)
at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:402)
at org.apache.hadoop.io.SequenceFile$Reader.(SequenceFile.java:1749)
at org.apache.hadoop.io.SequenceFile$Reader.(SequenceFile.java:1773)
at org.apache.hadoop.mapreduce.lib.partition.TotalOrderPartitioner.readPartitions(TotalOrderPartitioner.java:301)
at org.apache.hadoop.mapreduce.lib.partition.TotalOrderPartitioner.setConf(TotalOrderPartitioner.java:88)
... 10 more

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
MapReduce Jobs Launched:
Job 0: Map: 1 Reduce: 5 HDFS Read: 0 HDFS Write: 0 FAIL
Total MapReduce CPU Time Spent: 0
这个异常说是找不到分区文件，但我的明明存在分区文件，但却找不着，有点郁闷了；
网上常见一种解答方式说是job运行在本地，但是这个异常和网上说的似乎不一样，有一样的，但没有答案，求高手指教

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
迷途小码 2014-04-29 09:57
关注
SET total.order.partitioner.path=/ws/hbasetest/hbase_splits;
分区文件必须存在于hdfs中，本地文件不能被读取。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hive数据分析和hbase编程的特点 hbase hive 大数据
2022-12-14 16:03

回答 1 已采纳 hive和hbase都是大数据平台上的组件。hive类似于关系型数据库，按行存储，非常适合对sql比较熟悉的人按照sql语句进行数据处理。hbase属于非关系型数据库，采用列式存储，非常适合统计类的数
大数据hive分区表导入数据的问题 hive 大数据
2018-01-07 12:34

回答 5 已采纳 http://blog.csdn.net/fjssharpsword/article/details/64919412
hive中需要新建分区表且导入百亿数据量，如何最优实现 hadoop hive
2022-05-31 17:06

回答 2 已采纳百亿数据也不多，直接动态分区搞进去就行了
Hive使用HBaseBulkLoad导入Hbase
2022-05-20 11:28

weixin_43721102的博客如果数据量比较小，可以使用Hive和Hbase集成的方式（HBaseIntegration）完成数据的导入，同时通过Hive读取数据。集成方式如下： CREATE TABLE new_hbase_table(rowkey string, x int, y int) STORED BY 'org....
hive使用load导入csv文件，怎么自动创建分区? hadoop hive java 大数据
2018-04-13 09:50

回答 3 已采纳问过老大了，只能指定分区，不能自动分区
hive创建外部表导入csv数据格式出错 hadoop hive 大数据
2022-06-06 17:18

回答 2 已采纳在window用excel把csv改成\t 分割,建表分割符改成\t
关于#大数据#的问题：大数据实验Hive、M ySQL、HBase数据互导中，使用HBase J ava API把数据从本地导入到HBase中的ecli pse代码出问题要怎么解决吗 hadoop hbase 大数据
2022-12-20 13:34

回答 1 已采纳编译报错？是不是跟JDK可能有关系
大数据Sqoop借助Hive将Mysql数据导入至Hbase
2021-07-20 21:19

赵广陆的博客为什么使用 BulkLoad1.3 hive导入Hbase1.3.1 创建表1.3.2 导入数据至Hive表2. 从 Hive 中抽取数据到 HBase2.1. 准备数据2.1.1. 将数据导入到 MySQL2.1.2. 将数据导入到 Hive2.2. 工程配置2.3. Spark 任务2.4. 运行...
Hive导入$$分隔符文件 hive 大数据数据仓库
2022-07-26 16:15

回答 1 已采纳不能用row format delimited fields terminated by，改用 ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.
安装hbase后hive不能正常启动 hbase hive
2022-11-18 18:05

回答 3 已采纳有可能多按按回车就好了，有的时候是卡了
Hive中在整合HBase的表中插入数据时报错 hadoop hbase hive
2015-12-29 08:12

回答 1 已采纳 http://bbs.csdn.net/topics/390911781
hbase中为何不能向表中插入数据_大数据HBase面试题
2020-11-19 20:04

weixin_39866817的博客 1、 HBase的特点是什么？1）大：一个表可以有数十亿行，上百万列； 2）无模式：每行都有一个可排序的主键和任意多的列，列... 5）数据多版本：每个单元中的数据可以有多个版本，默认情况下版本号自动分配，是单元格...
如何优化hive动态分区写入速度？ hadoop hive 大数据
2022-05-21 17:53

回答 1 已采纳查询最后加上distribute by ORDERDATEsort by ORDERDATE distribute by按照指定的字段将数据划分到不同的输出reduce中，可以保证每个reduce处理
Sqoop数据迁移，导入数据至hdfs,hive,hbase,mysql
2020-07-23 06:32

我玩的很开心的博客 Sqoop数据迁移一、Sqoop概述二、Sqoop数据迁移1.从RDB(Relational Database)...导入数据到hive3.导入数据到HBase4.hdfs导出到MySQL三、执行Sqoop脚本四、执行Sqoop job任务一、Sqoop概述 Sqoop是什么？ Sqoop是一个用
Hive和Hbase数据整合交互
2021-04-27 10:22

idataduck的博客 1、通过 Hive 与 HBase 整合，可以将 HBase 的数据通过 Hive 来分析，让 HBase 支持 JOIN、GROUP 等 SQL 查询语法。 2、Hive和Hbase是两种基于Hadoop的不同技术，Hive是一种类SQL的引擎，并且运行MapReduce任务，...
没有解决我的问题, 去提问

悬赏问题

¥15 我想在一个软件里添加一个优惠弹窗，应该怎么写代码
¥15 fluent的在模拟压强时使用希望得到一些建议
¥15 STM32驱动继电器
¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏
¥15 模糊pid与pid仿真结果几乎一样
¥15 java的GUI的运用
¥15 Web.config连不上数据库
¥15 我想付费需要AKM公司DSP开发资料及相关开发。
¥15 怎么配置广告联盟瀑布流