python实现sql中"select count(distinct case when length(actno)>0 then actno else null end) from data_a group by community "
2条回答 默认 最新
关注 - 这篇博客: python与SQL学习比较中的 13.带条件的计数:count(distinct case when …end) 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
13. 带条件的计数:count(distinct case when …end)我们想统计:ts中含有‘2019-08-01’的不重复订单有多少,ts中含有‘2019-08-02’的不重复订单有多少。
#Hive SQL select count(distinct case when ts like '%2019-08-01%' then orderid end) as 0801_cnt, count(distinct case when ts like '%2019-08-02%' then orderid end) as 0802_cnt from t_order; #运行结果: 5 11
pandas中实现:
定义两个函数,第一个函数给原数据增加一列,标记我们的条件,第二个函数再增加一列,当满足条件时,给出对应的orderid,然后要对整个dataframe应用这两个函数。对于我们不关心的行,这两列的值都为nan。第三步再进行去重计数操作。#python #第一步:构造一个辅助列 def func_1(x): if '2019-08-01' in x['ts']: return '2019-08-01'#这个地方可以返回其他标记 elif '2019-08-02' in x['ts']: return '2019-08-02' else: return None #第二步:将符合条件的order作为新的一列 def func_2(x): if '2019-08-01' in x['ts']: return str(x['orderid']) elif '2019-08-02' in x['ts']: return str(x['orderid']) else: return None #应用两个函数,查看结果 #注意这里必须加上axis=1,你可以尝试下不加会怎样 order['cnt_condition'] = order.apply(func_1, axis=1) order['cnt'] = order.apply(func_2, axis=1) order[order['cnt'].notnull()] #进行分组计数 order.groupby('cnt_condition').agg({'cnt': 'nunique'})
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报- 这篇博客: python与SQL学习比较中的 13.带条件的计数:count(distinct case when …end) 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
悬赏问题
- ¥15 MYSQL 多表拼接link
- ¥15 关于某款2.13寸墨水屏的问题
- ¥15 obsidian的中文层级自动编号
- ¥15 同一个网口一个电脑连接有网,另一个电脑连接没网
- ¥15 神经网络模型一直不能上GPU
- ¥15 pyqt怎么把滑块和输入框相互绑定,求解决!
- ¥20 wpf datagrid单元闪烁效果失灵
- ¥15 券商软件上市公司信息获取问题
- ¥100 ensp启动设备蓝屏,代码clock_watchdog_timeout
- ¥15 Android studio AVD启动不了