CarbonData1.3.0导入数据出现锁问题

scala> carbon.sql("CREATE TABLE IF NOT EXISTS test_table(id string,name string,city string,age Int) STORED BY 'carbondata'")
18/03/01 22:35:12 AUDIT CarbonCreateTableCommand: [localhost.localdomain][root][Thread-1]Creating Table with Database name [default] and Table name [test_table]
res9: org.apache.spark.sql.DataFrame = []

scala> carbon.sql("SELECT * FROM test_table").show()
+---+----+----+---+
| id|name|city|age|
+---+----+----+---+
+---+----+----+---+

scala> carbon.sql("LOAD DATA INPATH '/opt/hadoop/sample.csv INTO TABLE test_table")
18/03/01 22:43:51 ERROR CarbonLoaderUtil: main Not able to acquire the lock for Table status updation for table default.test_table
18/03/01 22:43:51 ERROR CarbonLoaderUtil: main Unable to unlock Table lock for tabledefault.test_table during table status updation
18/03/01 22:43:51 ERROR CarbonLoadDataCommand: main
java.io.IOException: Dataload failed due to failure in table status updation for test_table
at org.apache.carbondata.processing.util.CarbonLoaderUtil.readAndUpdateLoadProgressInTableMeta(CarbonLoaderUtil.java:443)
at org.apache.carbondata.processing.util.CarbonLoaderUtil.readAndUpdateLoadProgressInTableMeta(CarbonLoaderUtil.java:449)
at org.apache.spark.sql.execution.command.management.CarbonLoadDataCommand.processData(CarbonLoadDataCommand.scala:236)
at org.apache.spark.sql.execution.command.AtomicRunnableCommand.run(package.scala:92)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult$lzycompute(commands.scala:58)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult(commands.scala:56)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.executeCollect(commands.scala:67)
at org.apache.spark.sql.Dataset.(Dataset.scala:183)
at org.apache.spark.sql.Dataset$.ofRows(Dataset.scala:68)
at org.apache.spark.sql.SparkSession.sql(SparkSession.scala:632)
at $line40.$read$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw.(:33)
at $line40.$read$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw.(:38)
at $line40.$read$$iw$$iw$$iw$$iw$$iw$$iw$$iw$$iw.(:40)
at $line40.$read$$iw$$iw$$iw$$iw$$iw$$iw$$iw.(:42)
at $line40.$read$$iw$$iw$$iw$$iw$$iw$$iw.(:44)
at $line40.$read$$iw$$iw$$iw$$iw$$iw.(:46)
at $line40.$read$$iw$$iw$$iw$$iw.(:48)
at $line40.$read$$iw$$iw$$iw.(:50)
at $line40.$read$$iw$$iw.(:52)
at $line40.$read$$iw.(:54)
at $line40.$read.(:56)
at $line40.$read$.(:60)
at $line40.$read$.()
at $line40.$eval$.$print$lzycompute(:7)
at $line40.$eval$.$print(:6)
at $line40.$eval.$print()
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at scala.tools.nsc.interpreter.IMain$ReadEvalPrint.call(IMain.scala:786)
at scala.tools.nsc.interpreter.IMain$Request.loadAndRun(IMain.scala:1047)
at scala.tools.nsc.interpreter.IMain$WrappedRequest$$anonfun$loadAndRunReq$1.apply(IMain.scala:638)
at scala.tools.nsc.interpreter.IMain$WrappedRequest$$anonfun$loadAndRunReq$1.apply(IMain.scala:637)
at scala.reflect.internal.util.ScalaClassLoader$class.asContext(ScalaClassLoader.scala:31)
at scala.reflect.internal.util.AbstractFileClassLoader.asContext(AbstractFileClassLoader.scala:19)
at scala.tools.nsc.interpreter.IMain$WrappedRequest.loadAndRunReq(IMain.scala:637)
at scala.tools.nsc.interpreter.IMain.interpret(IMain.scala:569)
at scala.tools.nsc.interpreter.IMain.interpret(IMain.scala:565)
at scala.tools.nsc.interpreter.ILoop.interpretStartingWith(ILoop.scala:807)
at scala.tools.nsc.interpreter.ILoop.command(ILoop.scala:681)
at scala.tools.nsc.interpreter.ILoop.processLine(ILoop.scala:395)
at scala.tools.nsc.interpreter.ILoop.loop(ILoop.scala:415)
at scala.tools.nsc.interpreter.ILoop$$anonfun$process$1.apply$mcZ$sp(ILoop.scala:923)
at scala.tools.nsc.interpreter.ILoop$$anonfun$process$1.apply(ILoop.scala:909)
at scala.tools.nsc.interpreter.ILoop$$anonfun$process$1.apply(ILoop.scala:909)
at scala.reflect.internal.util.ScalaClassLoader$.savingContextLoader(ScalaClassLoader.scala:97)
at scala.tools.nsc.interpreter.ILoop.process(ILoop.scala:909)
at org.apache.spark.repl.Main$.doMain(Main.scala:74)
at org.apache.spark.repl.Main$.main(Main.scala:54)
at org.apache.spark.repl.Main.main(Main.scala)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:775)
at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:119)
at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
18/03/01 22:43:51 AUDIT CarbonLoadDataCommand: [localhost.localdomain][root][Thread-1]Dataload failure for default.test_table. Please check the logs
18/03/01 22:43:51 ERROR CarbonLoadDataCommand: main Got exception java.io.IOException: Dataload failed due to failure in table status updation for test_table when processing data. But this command does not support undo yet, skipping the undo part.
java.io.IOException: Dataload failed due to failure in table status updation for test_table
at org.apache.carbondata.processing.util.CarbonLoaderUtil.readAndUpdateLoadProgressInTableMeta(CarbonLoaderUtil.java:443)
at org.apache.carbondata.processing.util.CarbonLoaderUtil.readAndUpdateLoadProgressInTableMeta(CarbonLoaderUtil.java:449)
at org.apache.spark.sql.execution.command.management.CarbonLoadDataCommand.processData(CarbonLoadDataCommand.scala:236)
at org.apache.spark.sql.execution.command.AtomicRunnableCommand.run(package.scala:92)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult$lzycompute(commands.scala:58)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult(commands.scala:56)
at org.apache.spark.sql.execution.command.ExecutedCommandExec.executeCollect(commands.scala:67)
at org.apache.spark.sql.Dataset.(Dataset.scala:183)
at org.apache.spark.sql.Dataset$.ofRows(Dataset.scala:68)
at org.apache.spark.sql.SparkSession.sql(SparkSession.scala:632)
... 50 elided

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
BugsCode 2018-03-02 08:52
关注
官方解决锁方案：

import org.apache.carbondata.core.util.CarbonProperties
import org.apache.carbondata.core.constants.CarbonCommonConstants
CarbonProperties.getInstance().addProperty(CarbonCommonConstants.LOCK_TYPE, "HDFSLOCK")

再把自己的读取方式由
carbon.sql("LOAD DATA INPATH '/opt/hadoop/sample.csv' INTO TABLE test_table")
改为
carbon.sql("LOAD DATA INPATH 'hdfs://localhost:9000/user/root/input/sample.csv' INTO TABLE test_table")

scala> carbon.sql("LOAD DATA INPATH 'hdfs://localhost:9000/user/root/input/sample.csv' INTO TABLE test_table")
18/03/02 00:46:14 AUDIT CarbonDataRDDFactory$: [localhost.localdomain][root][Thread-1]Data load request has been received for table default.test_table
18/03/02 00:46:14 WARN CarbonDataProcessorUtil: main sort scope is set to LOCAL_SORT
18/03/02 00:46:17 WARN CarbonDataProcessorUtil: [Executor task launch worker for task 0][partitionID:table;queryID:1114726938817] sort scope is set to LOCAL_SORT
18/03/02 00:46:17 WARN CarbonDataProcessorUtil: [Executor task launch worker for task 0][partitionID:table;queryID:1114726938817] batch sort size is set to 0
18/03/02 00:46:17 WARN CarbonDataProcessorUtil: [Executor task launch worker for task 0][partitionID:table;queryID:1114726938817] sort scope is set to LOCAL_SORT
18/03/02 00:46:17 WARN CarbonDataProcessorUtil: [Executor task launch worker for task 0][partitionID:table;queryID:1114726938817] Error occurs while creating dirs: /tmp/carbon1114860648927_0/Fact/Part0/Segment_0/0
18/03/02 00:46:17 WARN CarbonDataProcessorUtil: [Executor task launch worker for task 0][partitionID:table;queryID:1114726938817] sort scope is set to LOCAL_SORT
18/03/02 00:46:20 AUDIT CarbonDataRDDFactory$: [localhost.localdomain][root][Thread-1]Data load is successful for default.test_table
res3: org.apache.spark.sql.DataFrame = []

scala> carbon.sql("SELECT * FROM test_table").show()
+---+----+----+---+
| id|name|city|age|
+---+----+----+---+
| 1|aaaa| xm| 20|
| 2|bbbb| xm| 21|
| 3|cccc| zz| 30|
| 4|dddd| hh| 20|
+---+----+----+---+

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于maven导入依赖的问题 java maven spring
2022-03-29 10:51

回答 1 已采纳 <module>cloud-provider-payment8001</module> <module>cloud-consumer-order80&l
安装pytorch出现问题求解决 python pytorch 深度学习
2023-02-12 15:35

回答 2 已采纳更新一下conda再重试。conda update -n base condaconda update --all
springcloud 阿里巴巴，nacos seata1.3.0 java
2021-07-09 14:44

回答 1 已采纳不用管
Apache CarbonData1.3简介
2018-02-09 10:52

weixin_30474613的博客针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，并通过多级索引、字典编码、...
为什么xlwt-1.3.0在pycharm上安装报错 python
2021-10-20 13:07

回答 1 已采纳从提示，可以清晰的看到，你估计是没有设置环境变量。在cmd中，没有识别到命令。
关于springboot启动不成功问题 java spring boot spring cloud
2022-02-28 18:57

回答 1 已采纳 classpath:/application.yml 去掉 / 试试吧
计算机视觉环境安装多个函数（包括opencv）时出现找不到满足条件的版本的问题 opencv 计算机视觉
2022-04-01 17:46

回答 1 已采纳你这个TensorFlow2.0也不是这个写法呀，一般是tensorflow==2.4.0,之后再去安装其他的依赖库。之后想要同时安装多个依赖库，首先你每个依赖库需要写版本号例如你的scipy==1
实现一份数据的梦想, Apache CarbonData里程碑式版本1.3发布
2018-02-09 00:00

大数据和云计算技术的博客针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，并通过多级索引、字
关于#pytorch#的问题：pytorch1.3.0 + cuda101对应的Pyg库（torch-geometric及相应依赖）官网不在提供，请问还有什么途径可以下载安装吗(语言-python) python pytorch
2022-11-21 11:34

回答 1 已采纳最简单的方案是，根据现有的pyg库的需求配置环境，比如cuda要求什么给什么等。比如目前好像最低是torch1.4和cuda10.2.如果这个无法接受，那么只能从源码安装的方式来安装了，具体请看htt
R语言绘制火山图对数据使用case when函数报错 r语言
2023-04-02 20:53

回答 6 已采纳引用chatGPT作答，这个错误信息的意思是不能将大小为0的对象“..1（left）”与大小为1271的对象“..2（left）”进行循环使用。很可能是由于您的case_when()函数中的某些条件未
无效的导入路径-Go + Windows windows
2017-07-26 10:05

回答 1 已采纳 You have to use forward slashes / in import paths (of import declarations), even if you're on Wind
基于Hadoop生态系统的一种高性能数据存储格式CarbonData（性能篇）
2018-07-06 17:29

云布道师的博客 1）测试数据创建沈阳社保的数据仓库，导入、集成1年的测试数据，如下表：生成CarbonData格式文件，如下表： 2）过滤查询场景测试 Parquet和CarbonData在过滤查询场景下的性能对比 3）聚合计算场景测试 Parquet和...
安装weblogic时候遇到这个问题怎么解决？？ java 有问必答
2021-05-20 09:19

回答 6 已采纳什么问题，你把问题描述出来
Apache CarbonData里程碑式版本1.3发布
2018-02-08 18:00

糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖的博客针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，并通过多级...
Apache CarbonData里程碑式版本1.3发布，多个重要新特性
2018-02-09 00:00

Hadoop技术博文的博客本文经过 ApacheCarbonData...针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，并通
Apache CarbonData 1.4.0 正式发布，多项新功能及性能提升
2018-06-06 09:24

Hadoop技术博文的博客 Apache CarbonData 1.4.0 下载地址：https://dist.apache.org/repos/dist/release/carbondata/1....
Hadoop文章收集汇总 - 如禁止转载，请及时联系本人收集学习互联网各位前辈分享的文章
2018-09-30 11:00

jast_zsh的博客安装CDSW数据磁盘初始化异常问题分析罗康 2018/8/14 0:01 Hadoop实操重庆某项目生产集群扩容问题总结及复盘罗康 2018/8/14 0:01 Hadoop实操如何为CDH集群配置机架感知 ...
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

CarbonData1.3.0导入数据出现锁问题

1条回答 默认 最新

悬赏问题

1条回答默认最新