oozie调用sqoop import任务，一直处于running状态

sqoop import命令在窗口直接执行时没有问题的，但是通过oozie去调用就出现这种问题
oozie调用sqoop list-databases也是可以成功的
有没有大神给分析一下是哪些地方的问题，内存不足还是什么问题
workflow.xml

<action name="sqoop-node">
    <sqoop xmlns="uri:oozie:sqoop-action:0.3">
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <configuration>
            <property>
                <name>mapred.job.queue.name</name>
                <value>${queueName}</value>
            </property>
        </configuration>
        <command>import --connect jdbc:mysql://10.148.1.100:3306/test --username root --password 123456 --table person --target-dir /user/root/testSqoop/output --fields-terminated-by "," --num-mappers 1 --direct</command>
    </sqoop>
    <ok to="end"/>
    <error to="fail"/>
</action>

<kill name="fail">
    <message>Sqoop failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<end name="end"/>

oozie console
图片说明

hadoop applacation
图片说明

疑问为什么会起两个 MAPREDUCE任务

虚拟机内存情况
图片说明

日志信息
2018-06-14 11:08:20,625 [uber-SubtaskRunner] WARN org.apache.sqoop.tool.SqoopTool - $SQOOP_CONF_DIR has not been set in the environment. Cannot check for additional configuration.
2018-06-14 11:08:20,649 [uber-SubtaskRunner] INFO org.apache.sqoop.Sqoop - Running Sqoop version: 1.4.6
2018-06-14 11:08:20,664 [uber-SubtaskRunner] WARN org.apache.sqoop.tool.BaseSqoopTool - Setting your password on the command-line is insecure. Consider using -P instead.
2018-06-14 11:08:20,676 [uber-SubtaskRunner] WARN org.apache.sqoop.ConnFactory - $SQOOP_CONF_DIR has not been set in the environment. Cannot check for additional configuration.
2018-06-14 11:08:20,779 [uber-SubtaskRunner] INFO org.apache.sqoop.manager.MySQLManager - Preparing to use a MySQL streaming resultset.
2018-06-14 11:08:20,784 [uber-SubtaskRunner] INFO org.apache.sqoop.tool.CodeGenTool - Beginning code generation
2018-06-14 11:08:21,235 [uber-SubtaskRunner] INFO org.apache.sqoop.manager.SqlManager - Executing SQL statement: SELECT t.* FROM person AS t LIMIT 1
2018-06-14 11:08:21,261 [uber-SubtaskRunner] INFO org.apache.sqoop.manager.SqlManager - Executing SQL statement: SELECT t.* FROM person AS t LIMIT 1
2018-06-14 11:08:21,266 [uber-SubtaskRunner] INFO org.apache.sqoop.orm.CompilationManager - HADOOP_MAPRED_HOME is /opt/hadoop-2.6.0
2018-06-14 11:08:23,470 [uber-SubtaskRunner] INFO org.apache.sqoop.orm.CompilationManager - Writing jar file: /tmp/sqoop-root/compile/8750ac72c9db5da23fa902b0a16d1957/person.jar
2018-06-14 11:08:23,485 [uber-SubtaskRunner] INFO org.apache.sqoop.manager.DirectMySQLManager - Beginning mysqldump fast path import
2018-06-14 11:08:23,485 [uber-SubtaskRunner] INFO org.apache.sqoop.mapreduce.ImportJobBase - Beginning import of person
2018-06-14 11:08:23,486 [uber-SubtaskRunner] INFO org.apache.hadoop.conf.Configuration.deprecation - mapred.job.tracker is deprecated. Instead, use mapreduce.jobtracker.address
2018-06-14 11:08:23,491 [uber-SubtaskRunner] INFO org.apache.hadoop.conf.Configuration.deprecation - mapred.jar is deprecated. Instead, use mapreduce.job.jar
2018-06-14 11:08:23,505 [uber-SubtaskRunner] INFO org.apache.hadoop.conf.Configuration.deprecation - mapred.map.tasks is deprecated. Instead, use mapreduce.job.maps
2018-06-14 11:08:23,509 [uber-SubtaskRunner] WARN org.apache.sqoop.mapreduce.JobBase - SQOOP_HOME is unset. May not be able to find all job dependencies.
2018-06-14 11:08:23,559 [uber-SubtaskRunner] INFO org.apache.hadoop.yarn.client.RMProxy - Connecting to ResourceManager at study/10.148.1.100:8032
2018-06-14 11:08:23,928 [uber-SubtaskRunner] INFO org.apache.sqoop.mapreduce.db.DBInputFormat - Using read commited transaction isolation
2018-06-14 11:08:23,996 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.JobSubmitter - number of splits:1
2018-06-14 11:08:24,051 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.JobSubmitter - Submitting tokens for job: job_1528942657382_0005
2018-06-14 11:08:24,051 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.JobSubmitter - Kind: YARN_AM_RM_TOKEN, Service: , Ident: (appAttemptId { application_id { id: 4 cluster_timestamp: 1528942657382 } attemptId: 1 } keyId: 589196118)
2018-06-14 11:08:24,053 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.JobSubmitter - Kind: RM_DELEGATION_TOKEN, Service: 10.148.1.100:8032, Ident: (owner=root, renewer=oozie mr token, realUser=root, issueDate=1528945693299, maxDate=1529550493299, sequenceNumber=3, masterKeyId=2)
2018-06-14 11:08:24,211 [uber-SubtaskRunner] WARN org.apache.hadoop.mapreduce.v2.util.MRApps - cache file (mapreduce.job.cache.files) hdfs://study:9000/user/root/testSqoop/lib/sqoop-1.4.6-hadoop200.jar conflicts with cache file (mapreduce.job.cache.files) hdfs://study:9000/tmp/hadoop-yarn/staging/root/.staging/job_1528942657382_0005/libjars/sqoop-1.4.6-hadoop200.jar This will be an error in Hadoop 2.0
2018-06-14 11:08:24,213 [uber-SubtaskRunner] WARN org.apache.hadoop.mapreduce.v2.util.MRApps - cache file (mapreduce.job.cache.files) hdfs://study:9000/user/root/testSqoop/lib/mysql-connector-java.jar conflicts with cache file (mapreduce.job.cache.files) hdfs://study:9000/tmp/hadoop-yarn/staging/root/.staging/job_1528942657382_0005/libjars/mysql-connector-java.jar This will be an error in Hadoop 2.0
2018-06-14 11:08:24,265 [uber-SubtaskRunner] INFO org.apache.hadoop.yarn.client.api.impl.YarnClientImpl - Submitted application application_1528942657382_0005
2018-06-14 11:08:24,301 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.Job - The url to track the job: http://study:8088/proxy/application_1528942657382_0005/
2018-06-14 11:08:24,301 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.Job - The url to track the job: http://study:8088/proxy/application_1528942657382_0005/
2018-06-14 11:08:24,302 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.Job - Running job: job_1528942657382_0005
2018-06-14 11:08:24,302 [uber-SubtaskRunner] INFO org.apache.hadoop.mapreduce.Job - Running job: job_1528942657382_0005
2018-06-14 11:08:25,976 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
2018-06-14 11:08:25,976 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
Heart beat
2018-06-14 11:08:56,045 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
2018-06-14 11:08:56,045 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
Heart beat
2018-06-14 11:09:26,082 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
2018-06-14 11:09:26,082 [communication thread] INFO org.apache.hadoop.mapred.TaskAttemptListenerImpl - Progress of TaskAttempt attempt_1528942657382_0004_m_000000_0 is : 1.0
Heart beat

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
木易二月 2018-06-14 04:30
关注
33763 [uber-SubtaskRunner] WARN org.apache.sqoop.hive.TableDefWriter - Column DB_TID had to be cast to a less precise type in Hive
33763 [uber-SubtaskRunner] WARN org.apache.sqoop.hive.TableDefWriter - Column PROD_TID had to be cast to a less precise type in Hive
33763 [uber-SubtaskRunner] WARN org.apache.sqoop.hive.TableDefWriter - Column TM_TID had to be cast to a less precise type in Hive
33763 [uber-SubtaskRunner] WARN org.apache.sqoop.hive.TableDefWriter - Column STATE had to be cast to a less precise type in Hive
这个是因为导入的数据类型和被导入的数据类型，二者不一致，需要使用cast转换下。
比如时间time，在hive里面需要转换为时间戳。

sqoop import --connect "jdbc:sqlserver://xxxx:1433;DatabaseName=test" --username xxx --password 123456 --query 'SELECT 。。。。。。。 CAST (DB_TID AS hivetype), ... FROM AU_User WHERE $CONDITIONS'也就是将DB_TID 转换为hive的数据类型。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用hue集成oozie 运行 shell 脚本完成度为95% 状态持续为running
2018-10-23 06:47

回答 1 已采纳 https://blog.csdn.net/lujisen/article/details/79086716
oozie定时循环调度spark任务
2016-07-22 07:45

回答 2 已采纳刚写了一个测试程序试了一下，循环调度一个shell 。 shell中只有一个 sleep 42332423s 当次shell 未完成，下次循环不会去执行shell，该shell的状态是 r
oozie shell action 执行hql 执行的mr是本地模式
2015-12-07 00:56

回答 1 已采纳添加环境变量HADOOP_CONF_DIR=$HADOOP_CONF_DIR:/etc/hive/conf(后面是hive配置信息路径)
oozie定时调用sqoop从oracle中增量导入数据至hive表
2016-12-14 18:10

Yager523的博客说明：在大数据开发中，由于数据量非常的大，有时候需要将关系型数据库（Oracle/Postgresql/Mysql等）中的表...本文就oozie定时调用sqoop从oracle库中增量导入数据至hive表涉及到的问题做了详细的讨论，仅供参考。
Oozie求救！！报错 Error putting entity null to TimelineServer org.apache.hadoop.yarn.exceptions.YarnException: Incomplete entity without entity id/type java
2020-09-22 11:00

回答 4 已采纳没解决，后来发现这个报错不影响正常的工作调度，就没管了去年年初就弃用oozie了，实在太坑了
Beat
2017-11-27 02:28

回答 1 已采纳 http://blog.csdn.net/u010372095/article/details/41849705
oozie调度sqoop踩坑之路（hue配置）
2018-08-27 23:36

深寒色的猫丶的博客通过oozie来调度管理sqoop数据抽取流程，一般有两种方法：一是直接使用oozie的sqoop-action，二是将sqoop语句写在shell脚本中，通过shell-action来调度。经过测试，sqoop-action实在是坑多，故采用坑相对较少的shell...
Hue中使用oozie调用shell启动sqoop报错
2020-12-01 15:20

love_lixr的博客 2020-12-01 14:23:01,841 INFO org.apache.oozie.command.wf.ActionStartXCommand: SERVER[cdh-dev5] USER[itview] GROUP[-] TOKEN[] APP[SqoopTest] JOB[0000000-201201142033410-oozie-oozi-W] ACTION[0000000-...
sqoop oracle hive 类型报错,oozie调sqoop从oracle把数导入到hive报错解决
2021-05-01 05:41

南洋浪客的博客 oozie调sqoop从oracle把数导入到hive中，用oozie调度会报以下的错，但是直接用sqoop运行脚本就没有问题51370 [Thread-67] INFOorg.apache.sqoop.hive.HiveImport- FAILED: Error in semantic analysis: Line 2:17...
oozie治理导oracle所有数据,oozie调sqoop从oracle把数导入到hive报错解决
2021-05-07 11:45

李小编的博客 oozie调sqoop从oracle把数导入到hive中，用oozie调度会报以下的错，但是直接用sqoop运行脚本就没有问题51370 [Thread-67] INFOorg.apache.sqoop.hive.HiveImport- FAILED: Error in semantic analysis: Line 2:17...
大数据实操篇 No.6-Sqoop 部署及使用
2020-08-05 23:29

pezynd的博客第1章 Apache Sqoop简介 Sqoop是一款开源的工具，主要用于hadoop（hive）与结构化的数据库（例如：关系型数据库mysql……）之间，进行高效的传输批量数据。注意在官网还有一个版本：Sqoop2，这个Sqoop2官方说明不...
sqoop
2022-10-18 19:22

小小大数据的博客 Sqoop搭建及基础
离线计算七辅助系统（flume、sqoop、oozie）
2018-10-28 22:52

志明与春娇的博客课程大纲（辅助系统）离线辅助系统数据接入 Flume介绍 Flume组件 Flume实战案例任务调度调度器基础市面上调度工具 Oozie的使用 Oozie的流程定义详解 ...1、理解flume、sqoop、oozie的应用场景 2、理解flum...
没有解决我的问题, 去提问

悬赏问题

¥15 SQL Server下载
¥15 python如何将动态的多个子列表，拼接后进行集合的交集
¥20 vitis-ai量化基于pytorch框架下的yolov5模型
¥15 如何实现H5在QQ平台上的二次分享卡片效果？
¥15 python爬取bilibili校园招聘网站
¥30 求解达问题（有红包）
¥15 请解包一个pak文件
¥15 不同系统编译兼容问题
¥100 三相直流充电模块对数字电源芯片在物理上它必须具备哪些功能和性能？
¥30 数字电源对DSP芯片的具体要求

oozie调用sqoop import任务，一直处于running状态

3条回答 默认 最新

悬赏问题

3条回答默认最新