mizuhokaga 2021-09-28 08:13 采纳率: 50%
浏览 66
已结题

如何通过解析hive sql 得到该sql的数据血缘关系,最好可以到字段级。提供思路就行。

1.公司需求是给定 hive sql,这边需要仅根据该sql 分析出表、字段级别的血缘关系。效果类似

(公司之前没人写过数据血缘)
2.我查资料现在有两条路子:一是解析sql得到AST,然后自己慢慢磨AST。二是用hive自带 LineageInfo、Lineage Logger 这种Hook做。
3.第一条路子我查了下GitHub和gitee,有类似项目但只支持标准sql。我测试了一下公司sql有bug也不会改,这里搁置。这一步我可以拿到ast树但具体解析太复杂了。第二条路子我和leader交流后,leader觉得得依赖hive,每次看血缘得跑一次hive,他建议我能不能从hive源码中抽取相关组件,然后再放到spring boot中。

大家有啥好点子。包括不限于sql解析器推荐啥的

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-09-30 11:40
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 10月6日
  • 创建了问题 9月28日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题