问题遇到的现象和发生背景
想解决HIVE里的空值带来的数据倾斜问题。
通过生成随机数把值打散,如果customer_key is null就给它赋值随机数。
问题相关代码,请勿粘贴截图
CASE WHEN
a.`customer_key` IS NULL OR LENGTH(a.`customer_key`) < 2
THEN
udf函数生成的key
ELSE a.`customer_key` END = b.`key`
;
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果
通过生成随机数把值打散,如果customer_key is null就给它赋值随机数。