flinkSQL连接hive在集群上执行insert 报错.staging_1646118395295 does not exist.

问题遇到的现象和发生背景

用Flink SQL连接hive，执行tableEnv.executeSql("insert into table1 select * fromtable2")，本地运行正常，集群上执行per-job模式时如果select的查询结果为空，就会报临时文件staging_1646118395295 不存在，如果不为空就能正常执行。

问题相关代码，请勿粘贴截图

public class CodeCorDwmFour {
public static void main(String[] args) {

    EnvironmentSettings settings = EnvironmentSettings.newInstance().useBlinkPlanner().inBatchMode().build();
    TableEnvironment tableEnv = TableEnvironment.create(settings);
    String name = "myhive";
    String defaultDatabase = "ly_test";
    String hiveConfDir = "/etc/hive/conf";
    HiveCatalog hive = new HiveCatalog(name, defaultDatabase, hiveConfDir);
    tableEnv.registerCatalog("myhive", hive);
    tableEnv.useCatalog("myhive");
    tableEnv.executeSql(
            "insert overwrite dwm_mart.dwm_list_compoutcd_tmp_02" +
                    " select " +
                    "    t.*" +
                    " from dwm_mart.dwm_tq_comp_codecor_e50_cr_tmp t \n " +
                    "     left  join dwm_mart.dwm_list_compoutcd_tmp_01 tmp on t.outcode = tmp.outcode and t.compname = tmp.compname \n" +
                    " where not (tmp.outcode is not null and tmp.compname is not null) ");

}

}

运行结果及报错内容

Caused by: java.io.FileNotFoundException: File hdfs://knowlegene/user/hive/warehouse/ly_test.db/stu/.staging_1646118395295 does not exist.
at org.apache.hadoop.hdfs.DistributedFileSystem.listStatusInternal(DistributedFileSystem.java:697) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.hadoop.hdfs.DistributedFileSystem.access$600(DistributedFileSystem.java:105) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.hadoop.hdfs.DistributedFileSystem$15.doCall(DistributedFileSystem.java:755) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.hadoop.hdfs.DistributedFileSystem$15.doCall(DistributedFileSystem.java:751) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.hadoop.hdfs.DistributedFileSystem.listStatus(DistributedFileSystem.java:751) ~[flink-shaded-hadoop-2-uber-2.6.5-10.0.jar:2.6.5-10.0]
at org.apache.flink.hive.shaded.fs.hdfs.HadoopFileSystem.listStatus(HadoopFileSystem.java:170) ~[flink-connector-hive_2.11-1.13.2.jar:1.13.2]
at org.apache.flink.table.filesystem.PartitionTempFileManager.headCheckpoints(PartitionTempFileManager.java:137) ~[flink-table-blink_2.11-1.13.2.jar:1.13.2]
at org.apache.flink.table.filesystem.FileSystemCommitter.commitUpToCheckpoint(FileSystemCommitter.java:93) ~[flink-table-blink_2.11-1.13.2.jar:1.13.2]
at org.apache.flink.table.filesystem.FileSystemOutputFormat.finalizeGlobal(FileSystemOutputFormat.java:91) ~[flink-table-blink_2.11-1.13.2.jar:1.13.2]
at org.apache.flink.runtime.jobgraph.InputOutputFormatVertex.finalizeOnMaster(InputOutputFormatVertex.java:148) ~[flink-dist_2.11-1.13.2.jar:1.13.2]
at org.apache.flink.runtime.executiongraph.DefaultExecutionGraph.vertexFinished(DefaultExecutionGraph.java:1088) ~[flink-dist_2.11-1.13.2.jar:1.13.2]
32 more

我的解答思路和尝试过的方法

我想要达到的结果

怎么才能解决这个问题，无论select * from table2 是否为空都可正常执行，至少不报错，让后续调度任务可以执行。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
新民工涛哥 2022-03-28 13:08
关注
在集群中，hive 是否有正确的读写权限？可能是某些目录权限不对，写不进去。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Flink SQL查询报错 flink hive sql
2021-12-03 11:35

回答 2 已采纳找不到方法一般是打包时缺少该jar包，或者jar冲突。jar 冲突时，可以exclude其中一个jar依赖或者重新打包flink-hive-connector 通过 maven 插件重命名guava
FileNotFoundException: File does not exist java linux mysql ubuntu
2021-02-14 17:26

回答 1 已采纳看看这个： https://blog.csdn.net/wangshuminjava/article/details/80179648
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
hive sql报错记录：Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask
2019-07-03 14:40

ne-boy的博客最近在用公司集群hive跑sql时总是会遇到如下报错： FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask 但是在hive.log里很奇怪，没有找到什么有用信息，原因暂时不明。 ...
hive脚本把exists或not exist改成inner join或left join hive sql 大数据
2022-04-29 16:15

回答 1 已采纳 SELECT T.*, '个人客户' ERROR_TWO_TYPE FROM (SELECT * FROM SRBZ_HIVE.TMP_YWJH_ZQZRR_GR_
创建hive的表报错 hive
2022-05-17 01:29

回答 3 已采纳你还没有test_hive1数据库，需要先建库再建表
关于hive上NOT IN改为左连接left join hive sql 大数据
2022-04-28 23:51

回答 1 已采纳 DROP TABLE IF EXISTS TMP_YWJH_YKDZ_04;CREATE TABLE TMP_YWJH_YKDZ_04 ASSELECT A.*, B.LNX_NUM LNX_NUMF
大数据集群搭建（jdk、hadoop、hive、mysql、spark、flume、zookeeper）
2021-03-20 11:43

呼伦贝尔-钢蛋儿的博客集群环境目录版本系统 centos7 jdk 1.8 hadoop 2.6.1 导管 $1 细节记录：（放在搭建文档下面）第一步：怎么找Hadoop的历史版本点击下载点击历史版本，选择2.6.1即可
hive | o.a.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out flink hive spark
2021-12-15 08:56

回答 2 已采纳 [HIVE-22196] Socket timeouts happen when other drivers set DriverManager.loginTimeout - ASF JIRA程序中使
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
File not found: File does not exist: reduce.xml elasticsearch hive
2016-03-24 05:38

回答 3 已采纳 ubuntu的磁盘空间不足了删除了一些文件虽然还是没有这个文件但是能往下继续运行获得结果了
大数据技术之 Sqoop
2021-01-16 23:16

dwjf321的博客 Sqoop 的简单实用案例4.1 导入数据4.1.1 RDBMS 到 HDFS4.1.1.1 导入数据4.1.2 RDBMS 到Hive4.1.3 RDBMS 到Hbase4.2 导出数据4.2.1 HIVE/HDFS 到 RDBMS4.3 脚本打包5. Sqoop 一些常用命令及参数5.1 常用
Hive：class jdk.internal.loader.ClassLoaders hive 有问必答
2022-03-05 15:32

回答 3 已采纳这个错误就是跟jdk版本有关系。你可以降低版本，用jdk7试试。
分布式集群上安装hive及问题解决
2018-09-03 14:05

技多不压身的博客公司要在arm架构上安装...因为hive是数据仓库，它主要就是将执行的sql语句转化为mapreduce任务，存储结构化数据，其实数据还是存储在hdfs上的，所以依赖hadoop集群，在此我们将hive安装到master节点。首先，我们...
Impala SQL常见报错问题排查与解决记录
2022-03-11 22:14

johnny233的博客某个SQL通过hive-jdbc提交到大数据平台，报错如下： java.lang.Exception: java.sql.SQLException: The library hdfs:///udf/hive.udf-1.0.2.jar last modified time 1670929674 does not match the expected last ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月1日

悬赏问题

¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制