1.公司需求是给定 hive sql,这边需要仅根据该sql 分析出表、字段级别的血缘关系。效果类似
2.我查资料现在有两条路子:一是解析sql得到AST,然后自己慢慢磨AST。二是用hive自带 LineageInfo、Lineage Logger 这种Hook做。
3.第一条路子我查了下GitHub和gitee,有类似项目但只支持标准sql。我测试了一下公司sql有bug也不会改,这里搁置。这一步我可以拿到ast树但具体解析太复杂了。第二条路子我和leader交流后,leader觉得得依赖hive,每次看血缘得跑一次hive,他建议我能不能从hive源码中抽取相关组件,然后再放到spring boot中。
大家有啥好点子。包括不限于sql解析器推荐啥的