hive sql数据统计，详细说明一下，我需要弄懂，谢谢了

研究Hive SQL 完成以下统计任务，写出统计sql

CREATE TABLE t_order(
ord_id bigint,//订单号
ord_amount bigint,//订单金额
cust_id bigint,//客户id
ord_time string) //订单时间：格式如2018-01-01 00:00:00
PARTITIONED BY (
dt string)//日期分区，格式20180101

1、统计用户月复购率，用户复购率定义：在上月有订单记录的用户，在本月仍然订单记录的用户，占上月有订单记录的用户的比例。
2、假设表中有2018年1-3月每一天的交易金额，统计1-3月每一个用户每天当月累计到当日的交易金额

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
#朱守成# 2018-03-30 06:53
关注
select sum(if(t2.cust_id is not null, 1, 0)) / count(1) from (
select distinct cust_id from t_order o where o.ord_time>='2018-01-01' and o.ord_time < '2018-02-01'
) t
left join (
select distinct cust_id from t_order where ord_time>='2018-02-01' and ord_time < '2018-03-01'
) t2 on t.cust_id=t2.cust_id

这是第一个sql, 第一个子查询查出所有1月下单用户，第二个子查询查出所有2月下单用户，用第一个子查询left join 第二个子查询，这样结果集count(1) 仍然是第一个月的所有下单用户 sum(if(t2.cust_id is not null, 1, 0)) 则是二月所有下单用户且1月也下单的用户数

第二个没明白你的具体需求

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

大数据系列——什么是hive？hive用来干什么的？hive常见问题是啥？
2022-12-26 21:21

多则惑少则明的博客什么是hive？hive用来干什么的？hive常见问题是啥？
一文弄懂Hive中谓词下推(on与where的区别)
2022-09-09 10:05

DanielMaster的博客 Hive谓词下推与where和on的使用时机，一文就能理解透彻
大数据集群源数据同步之MySql2HIVE增量同步
2022-09-24 16:05

丰耳的博客纯干货，使用canal+kafka+camus一步一步完成MySQL到hive增量更新的全部详细过程
大数据开发实战：如何做企业级的数据服务产品
2025-07-02 23:06

涤生大数据的博客数据服务通常以解决方案的形式进行组织，面向一个应用场景的所有数据需求或数据内容可以通过一个解决方案进行封装，统一对外服务。一个数据需求或数据接口以一个数据服务实例的形式存在于解决方案之下。下游消费方...
一篇文章带你弄懂BI和大数据！
2019-01-08 20:10

程序の之道的博客 BI(Business Intelligence)，中文翻译是商务智能，是一套完整的解决方案，用来将组织中...为了将数据转化为知识，需要利用数据仓库、联机分析处理（OLAP）工具和数据挖掘等技术。商业智能的关键是从许多来自不同的...
一文搞懂大数据开发，大数据开发体系详解
2022-12-21 13:28

盈梓的博客的博客数据量大需要采集的数据量大需要存储的数据量大需要计算de 数据量大数据总体规模起码要TB、PB级别起步2.数据种类、来源多样化数据的种类多样，可能是类似MySQL一样的结构化数据，也可能是文本的非结构化数据，或者...
大数据快速入门（10）：Hive窗口函数
2020-11-07 16:45

KK架构的博客首先，需要认识到，窗口函数并不是只有 hive 才有的，SQL 语法标准中，就有窗口函数。并且 mysql，oracle等数据库都实现了窗口函数。而 hive 自带的窗口函数功能，则是对原有 hive sql 语法的补充和加强。那么...
大数据自学指南
2022-07-15 16:02

数据Ai指北的博客最强大数据自学指南。
一篇文章带你弄懂大数据！
2018-12-24 15:57

程序の之道的博客 大数据，big data，《大数据》一书对大数据这么定义，大数据是指不能用随机分析法(抽样调查)这样捷径，而采用所有数据进行分析处理。这句话至少传递两种信息： 1、大数据是海量的数据 2、大数据处理无捷径，对分析...
数据仓库ods层是啥意思_一文读懂大数据仓库建设
2020-12-17 02:16

WngWai的博客所以本文就来分享数仓建设的方法论，文中针对的例子是大数据环境下的数据仓库建设，从目前互联网行业数据的采集，存储，同步以及任务调度与监控方面阐述了相关技术，还专门针对数据仓库的维度建模技术做了详细的介绍...
没有解决我的问题, 去提问

hive sql数据统计，详细说明一下，我需要弄懂，谢谢了

2条回答 默认 最新

2条回答默认最新