当Oracle读的一行数据中有null时,会导致hive在写数据时把值前移,也就是说对应的null没有写上去,数据类型就对应错了,这个bug你们怎么解决的?然而mysql同步数据到hive,当mysql出现一行数据的一个有null或者多个null时,又不会出现hive写数据当有null而前移数据的问题。oracle reader正常配置,hive也是正常配置,文件类型orc,分隔符"/u0001",并且在datax中,关系数据库都是用的共同的读数据的工具类,因为这个工具类在循环获取读到的数据,读到null时会continue,所以我在它在continue前,把null加了进去,暂时解决了问题,但是其他数据例如mysql又不会出现这个问题,所以很奇怪,求大神解答,在线等。
2条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
最佳回答 专家已采纳查了一些资料,Datax源码的确有点问题,需要修改Datax的源码。
参考:datax mysql null不能转为Long 等一些列无法强转问题_大壮的博客-CSDN博客_datax null 首先来说一下前置,hive的hdfs文件,增量同步至mysql中。1.解决datax抽hdfs数据到mysql之null值变成 \N 或者 转换错误 的问题修改datax源码plugin-unstructured-storage-util下的UnstructuredStorageReaderUtil.class加上一个判断,因为在hdfs中,null值存储的是 \N ,...https://blog.csdn.net/qq_33792843/article/details/91987903
Datax的一次填坑经历 - 知乎 使用Datax进行两个集群间的数据同步,在读取HDFS数据时,会出现数据丢失问题,本文针对数据丢失问题做出了分析以及对应解决方案,希望帮助大家在使用Datax过程中避免该问题的出现!问题描述最近在使用Datax进行两…https://zhuanlan.zhihu.com/p/64852047
采纳该答案 已采纳该答案 专家已采纳评论解决 无用打赏举报微信扫一扫
分享评论登录 后可回复...
查看更多回答(1条)
报告相同问题?
提交
相关推荐 更多相似问题
- 2021-12-19 11:35回答 2 已采纳 查了一些资料,Datax源码的确有点问题,需要修改Datax的源码。参考: datax mysql null不能转为Long 等一些列无法强转问题_大壮的博客-CSDN博
- 2021-07-05 11:34回答 1 已采纳 JMX技术了解下 datax应该是支持这个的
- 2022-03-16 20:06回答 4 已采纳 可以考虑分成多线程进行处理,比如线程1处理序号1、4、7……线程2处理序号2、5、8……线程3处理序号3、6、9……
- 2019-08-26 19:15Yore Yuen的博客 本文主要介绍了常用的数据同步方案和使用的工具或平台,重点介绍了DataX,介绍了DataX的诸多便利之处,以及架构和DataX的调度流程。然后又介绍了DataX的各个数据源之间的离线数据同步,包括ODPS到HDFS、HDFS到HDFS、...
- 2020-07-17 17:39智_永无止境的博客 1、前言 mysql等数据存储技术,随着海量数据... DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute...
- 2020-04-19 18:13冰 河的博客 比如从oracle数据库中同步一张表的数据到Mysql中,通常的做法就是 分页查询源端的表,然后通过 jdbc的batch 方式插入到目标表,这个地方需要注意的是,分页查询时,一定要按照主键id来排序分页,避免重复插入。...
- 2021-12-28 16:04回答 1 已采纳 特殊符号问题?
- 2021-12-23 11:11回答 1 已采纳 官方有安装教程吗
- 2022-01-06 17:13回答 2 已采纳 你想问什么,麻烦描述清楚。
- 2021-01-26 21:20吃货落拓的博客 背景本文主要介绍如何使用阿里巴巴的开源工具Datax 实现从 MySQL 到 时序引擎 的数据迁移。...DataXDataX 是阿里巴巴集团内被广泛使用的离线数据同步工具 / 平台,实现包括 MySQL、Oracle、SqlServ...
- 2020-07-30 11:16郑鹏川的博客 (1) 定义:DataX是阿里巴巴内被广泛使用的异构数据源离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。...
- 2020-05-17 11:47无精疯的博客 一、早期关系型数据库之间的数据同步二、大数据时代下的数据同步三、总结一、早期关系型数据库之间的数据同步1)、全量同步比如从oracle数据库中同步一张表的数据到Mysql中,通常的做法就...
- 2022-03-16 19:07回答 3 已采纳 检查一下IP 用户。端口 这些是否正确。可以从自己跑程序的那台机器上试着用mysql 命令连接一下
- 2018-04-18 11:17回答 9 已采纳 你在writer读入达梦数据库时,通过配置文件读取不到达梦驱动,需手动将达梦数据库驱动加载进去。
- 2020-08-21 15:57回答 2 已采纳 线程被中断,比如说主程序提前结束,连接超时等,要找到具体的原因。你可以把代码放在一个单独的小程序里先测试好。
- 2021-12-05 15:47For Coding的博客 大数据Hadoop、Hive、Kafka、Hbase、Spark等框架面经
- 2022-01-03 08:40大数据技术派的博客 什么是列式存储所谓行式存储,指存储结构化数据时,在底层的存储介质上,数据是以行的方式来组织的,即存储完一条记录的所有字段,再存储下一条数据的所以字段,以此类推;所谓列式存储,指存储结构化数...
- 2021-01-18 19:46weixin_39844880的博客 从Mysql 到 InfluxDB的数据迁移背景本文主要介绍如何使用阿里巴巴的开源工具Datax 实现从 MySQL 到 InfluxDB 的数据迁移。DataX相关使用介绍请参阅 DataX 的README文档。下面将首先介绍 DataX 工具本身,以及本次...
- 2017-09-17 15:20回答 2 已采纳 可以采用分布式的方法
- 2021-02-11 12:52蒂埃里亨利的博客 背景本文主要介绍如何使用阿里巴巴的开源工具Datax 实现从 MySQL 到 TSDB 的数据迁移。DataX相关使用介绍请参阅 DataX 的 README 文档。下面将首先介绍 DataX 工具本身,以及本次迁移工作涉及到的两个插件(MySQL ...
- 没有解决我的问题, 去提问