hive解析json数组,统计通过率

hive表中有一个字段存储的是json数组
[{
"name": "max_operate_first_diff",
"rule": [{
"match": "max_operate_first_diff\u003c3972.0",
"priority": 1,
"description": "",
"result": -2,
"hit": "命中",
"value": 504
}, {
"match": "max_operate_first_diff\u003e=3972.0",
"priority": 2,
"description": "",
"result": 64,
"hit": "",
"value": 0
}]
}, {
"name": "up_sms",
"rule": [{
"match": " up_sms\u003c=1.0",
"priority": 1,
"description": "",
"result": 5,
"hit": "命中",
"value": 1
}, {
"match": " up_sms\u003e1.0",
"priority": 2,
"description": "",
"result": -13,
"hit": "",
"value": 0
}]
}]

需要统计每一个match对应的命中率,每一次传回来的rule条数不固定,match名字也不固定

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
憧憬blog 2023-03-15 03:55
关注
首先，需要将存储在hive表中的json数组解析为结构化数据，可以使用hive内置的json_tuple函数进行解析，然后使用 lateral view explode将数组中的每个元素拆分成一条记录。

假设存储json数组的字段名为json_array，解析后得到的字段名为name, match, priority, description, result, hit和value。

然后，可以使用group by和count函数统计每个match对应的命中次数和总次数，最后计算每个match对应的命中率。

以下是hive查询语句的示例：

SELECT match, SUM(CASE WHEN hit='命中' THEN 1 ELSE 0 END) AS hit_count, COUNT(*) AS total_count, SUM(CASE WHEN hit='命中' THEN 1 ELSE 0 END)/COUNT(*) AS hit_rate FROM your_table LATERAL VIEW explode(json_tuple(json_array, 'name', 'rule')) exploded AS name, rules LATERAL VIEW explode(parse_json(rules)) exploded_rules AS match, priority, description, result, hit, value GROUP BY match;

其中，parse_json函数用于解析json字符串。

需要注意的是，上述示例只是一种可能的实现方式，实际操作中还要根据具体的需求进行调整。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

hive解析json数组,统计通过率

1条回答 默认 最新

悬赏问题

1条回答默认最新