基于datax的二次开发,实现数据导入时,对完全相同的数据进行去重,
例如一个txt文件中,有;两条一模一样的数据,要对其进行去重之后入库
有没有做过基于datax二次开发,实现数据导入的去重功能
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
1999 2022-08-11 22:16关注我的理解是 原始数据重复的话可以用sql去重 目标数据重复一般都是 before 根据同步策略 按照时间呀 或者主键呀先删除再插入
解决 无用评论 打赏 举报
基于datax的二次开发,实现数据导入时,对完全相同的数据进行去重,
例如一个txt文件中,有;两条一模一样的数据,要对其进行去重之后入库
我的理解是 原始数据重复的话可以用sql去重 目标数据重复一般都是 before 根据同步策略 按照时间呀 或者主键呀先删除再插入