kafka数据上传hbase的问题

我使用的环境是hdp的伪分布集群
我的项目是flume采集数据发送到kafka的各个topic当中再由jar文件使得从kafka当中获取数据发送到hbase做持久化然后因为数据量颇大每次传个半个小时的数据 regionserver就挂掉了
项目是肯定没问题的因为目前在学习阶段别人是可以执行且不报错的

问题如下所示

java.io.FileNotFoundException: File /tmp/hbase-root/hbase/lib does not exist
    at org.apache.hadoop.fs.RawLocalFileSystem.listStatus(RawLocalFileSystem.java:431) ~[hadoop-common-2.7.3.jar!/:na]
    at org.apache.hadoop.fs.FileSystem.listStatus(FileSystem.java:1517) ~[hadoop-common-2.7.3.jar!/:na]
    at org.apache.hadoop.fs.FileSystem.listStatus(FileSystem.java:1557) ~[hadoop-common-2.7.3.jar!/:na]
    at org.apache.hadoop.fs.ChecksumFileSystem.listStatus(ChecksumFileSystem.java:674) ~[hadoop-common-2.7.3.jar!/:na]
    at org.apache.hadoop.hbase.util.DynamicClassLoader.loadNewJars(DynamicClassLoader.java:178) [hbase-common-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.util.DynamicClassLoader.loadClass(DynamicClassLoader.java:142) [hbase-common-1.1.2.jar!/:1.1.2]
    at java.lang.Class.forName0(Native Method) [na:1.8.0_161]
    at java.lang.Class.forName(Class.java:348) [na:1.8.0_161]
    at org.apache.hadoop.hbase.protobuf.ProtobufUtil.toException(ProtobufUtil.java:1543) [hbase-client-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.protobuf.ResponseConverter.getResults(ResponseConverter.java:120) [hbase-client-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.client.MultiServerCallable.call(MultiServerCallable.java:134) [hbase-client-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.client.MultiServerCallable.call(MultiServerCallable.java:54) [hbase-client-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.client.RpcRetryingCaller.callWithoutRetries(RpcRetryingCaller.java:200) [hbase-client-1.1.2.jar!/:1.1.2]
    at org.apache.hadoop.hbase.client.AsyncProcess$AsyncRequestFutureImpl$SingleServerRequestRunnable.run(AsyncProcess.java:708) [hbase-client-1.1.2.jar!/:1.1.2]

他突然开始寻找 File /tmp/hbase-root/hbase/lib does not exist 这个路径的文件我的项目中并没有从这个路径下寻找文件
我前往到这个路径路径是空的就是根本没有这个路径
然后我前往hbase的log中查看
hbase来了一套组合拳

2020-03-21 19:29:49,789 ERROR [Thread-19] util.PolicyRefresher: PolicyRefresher(serviceName=Sandbox_hbase): failed to refresh policies. Will continue to use last known version of policies (6)
com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler.handle(URLConnectionClientHandler.java:149)
    at com.sun.jersey.api.client.Client.handle(Client.java:648)
    at com.sun.jersey.api.client.WebResource.handle(WebResource.java:670)
    at com.sun.jersey.api.client.WebResource.access$200(WebResource.java:74)
    at com.sun.jersey.api.client.WebResource$Builder.get(WebResource.java:503)
    at org.apache.ranger.admin.client.RangerAdminRESTClient.getServicePoliciesIfUpdated(RangerAdminRESTClient.java:135)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicyfromPolicyAdmin(PolicyRefresher.java:264)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicy(PolicyRefresher.java:202)
    at org.apache.ranger.plugin.util.PolicyRefresher.run(PolicyRefresher.java:171)
Caused by: java.net.SocketTimeoutException: Read timed out
    at java.net.SocketInputStream.socketRead0(Native Method)
    at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
    at java.net.SocketInputStream.read(SocketInputStream.java:171)
    at java.net.SocketInputStream.read(SocketInputStream.java:141)
    at java.io.BufferedInputStream.fill(BufferedInputStream.java:246)
    at java.io.BufferedInputStream.read1(BufferedInputStream.java:286)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:345)
    at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:735)
    at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:678)
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream0(HttpURLConnection.java:1587)
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1492)
    at java.net.HttpURLConnection.getResponseCode(HttpURLConnection.java:480)
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler._invoke(URLConnectionClientHandler.java:240)
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler.handle(URLConnectionClientHandler.java:147)
    ... 8 more

然后就是读取超时

com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler.handle(URLConnectionClientHandler.java:149)
    at com.sun.jersey.api.client.Client.handle(Client.java:648)
    at com.sun.jersey.api.client.WebResource.handle(WebResource.java:670)
    at com.sun.jersey.api.client.WebResource.access$200(WebResource.java:74)
    at com.sun.jersey.api.client.WebResource$Builder.get(WebResource.java:503)
    at org.apache.ranger.admin.client.RangerAdminRESTClient.getServicePoliciesIfUpdated(RangerAdminRESTClient.java:135)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicyfromPolicyAdmin(PolicyRefresher.java:264)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicy(PolicyRefresher.java:202)
    at org.apache.ranger.plugin.util.PolicyRefresher.run(PolicyRefresher.java:171)

然后就是最匪夷所思的异常

2020-03-21 19:33:36,252 ERROR [Thread-19] util.PolicyRefresher: PolicyRefresher(serviceName=Sandbox_hbase): failed to refresh policies. Will continue to use last known version of policies (6)
com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler.handle(URLConnectionClientHandler.java:149)
    at com.sun.jersey.api.client.Client.handle(Client.java:648)
    at com.sun.jersey.api.client.WebResource.handle(WebResource.java:670)
    at com.sun.jersey.api.client.WebResource.access$200(WebResource.java:74)
    at com.sun.jersey.api.client.WebResource$Builder.get(WebResource.java:503)
    at org.apache.ranger.admin.client.RangerAdminRESTClient.getServicePoliciesIfUpdated(RangerAdminRESTClient.java:135)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicyfromPolicyAdmin(PolicyRefresher.java:264)
    at org.apache.ranger.plugin.util.PolicyRefresher.loadPolicy(PolicyRefresher.java:202)
    at org.apache.ranger.plugin.util.PolicyRefresher.run(PolicyRefresher.java:171)
Caused by: java.net.SocketTimeoutException: Read timed out
    at java.net.SocketInputStream.socketRead0(Native Method)
    at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
    at java.net.SocketInputStream.read(SocketInputStream.java:171)
    at java.net.SocketInputStream.read(SocketInputStream.java:141)
    at java.io.BufferedInputStream.fill(BufferedInputStream.java:246)
    at java.io.BufferedInputStream.read1(BufferedInputStream.java:286)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:345)
    at sun.net.www.http.HttpClient.parseHTTPHeader(HttpClient.java:735)
    at sun.net.www.http.HttpClient.parseHTTP(HttpClient.java:678)
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream0(HttpURLConnection.java:1587)
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1492)
    at java.net.HttpURLConnection.getResponseCode(HttpURLConnection.java:480)
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler._invoke(URLConnectionClientHandler.java:240)
    at com.sun.jersey.client.urlconnection.URLConnectionClientHandler.handle(URLConnectionClientHandler.java:147)
    ... 8 more

求大佬解答

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
树莓大王 2023-03-15 02:21
关注
根据你提供的问题，可能存在以下几个可能的原因：

HBase配置问题：错误信息中显示File /tmp/hbase-root/hbase/lib does not exist，看起来是在加载HBase相关的类库时出现了问题。检查HBase配置文件hbase-site.xml中配置的hbase.tmp.dir属性是否存在，并且是否配置正确。

系统资源不足：你说每次传送半个小时的数据，就导致了regionserver挂掉。这可能是由于系统资源不足导致的。你可以检查HBase的日志，查看是否有OOM（Out Of Memory）的错误，或者查看系统资源的使用情况（比如CPU、内存、硬盘空间等）。

网络问题：你的日志中出现了"java.net.SocketTimeoutException: Read timed out"的错误，这意味着HBase客户端无法正常连接HBase服务器。确保HBase服务器正常运行，并尝试使用其他工具测试客户端是否可以连接HBase服务器。

总之，以上的建议仅供参考，由于具体情况不得而知，若以上解决方案无效，请提供更多详细信息，以方便更好的解决问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用Java从Kafka读取数据到HBase
2022-04-15 17:44

行走的代码块qq的博客 1，添加依赖 <dependency> <groupId>org.springframework.kafka</groupId> <artifactId>spring-kafka</artifactId>...org.apache.hbase</groupId> <artifactId>
Kafka（数据从Kafka导入到Hbase)
2021-06-03 14:05

fishbaby-的博客数据从Kafka导入到Hbase一、数据从Kafka导入到Hbase（1) 非面向对象写法（2) 面向对象(OOP)写法1）先将这一段写成接口，这里面的内容根据不同的表数据结构而不同，其余部分的代码都几乎是不用变化的2）将写入hbase...
kafka上传至hbase(使用main方法)
2020-06-01 19:10

这条gai最靓的华哥的博客 java基本main写法：将数据从kafka->hbase1、新建hbase目录编写EventAttendeeshb java类编写UserFriendshb java类2、运行3、进入xshell 进行查看进hbase 查看表空间和表然后hbase查看 1、新建hbase目录编写...
kafka 三：Kafka数据上传至Hbase
2020-05-28 01:26

蔡大远的博客 kafka 三：数据上传至Hbase0:一：二：四：查看five 0: 在 hbase 中创建表 create_namespace ‘events_db’ list_namespace create ‘events_db:event_attendees’,‘euot’ create ‘events_db:user_friends’,‘of...
大数据——把Kafka中的数据传输到HBase中
2021-01-18 21:12

蜂蜜柚子加苦茶的博客日志数据导入一级目录二级目录三级目录一级目录二级目录三级目录总体 package nj.zb.kb09.kafkatohbase; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; ...
Kafka和Spark Streaming Java版本集成并将数据实时写入HBase
2018-04-11 18:48

小驴淘米666的博客转载地址：https://blog.csdn.net/q79969786/article/details/42793487Kafka和Spark Streaming Java版本集成并将数据实时写入HBasemvn配置pom.xml[html] view plain copy<project xmlns="...
基于Flume+Kafka+Hbase+Flink+FineBI的实时综合案例(二)数据源
2023-10-13 15:26

秒懂AI+的博客结果：生成模拟数据文件MOMO_DATA.dat，并且每条数据中字段分隔符为\001。删除Flume自带的guava包，替换成Hadoop的...需求：采集聊天数据，实时写入Kafka。需求：采集聊天数据，写入HDFS。测试：每500ms生成一条数据。
离线分析：Flume+Kafka+HBase+Hadoop通话数据统计
2021-05-24 14:43

一半@java的博客数据量如此巨大，除了要满足用户的实时查询和展示之外，还需要定时定期的对已有数据进行离线的分析处理。例如，当日话单，月度话单，季度话单，年度话单，通话详情，通话记录等等+。我们以此为背景，寻找一个切入点...
flinksql cdc mysql to kafka、Hbase
2022-08-10 17:29

大数据菜鸡一号的博客 flinksql cdc mysql to kafka,mysql to hbase,flinksql mysql 写入kafka ，mysql 写入hbase
kafka 四：（设计模式）Kafka数据上传至Hbase
2020-06-01 18:39

蔡大远的博客 kafka 四：（设计模式）Kafka数据上传至Hbasedatamove目录AttendeesHandler类IParseHandler接口UserFriendHandler类workEventAttendeesWorker类IWriter接口KafkaParentWorker类writerHBaseWriter类IWriter接口 ...
没有解决我的问题, 去提问

kafka数据上传hbase的问题

1条回答 默认 最新

1条回答默认最新