求python多条件按时间频率进行分组统计方法

要求：
需要通过python处理一个数据表，数据表里面包含操作时间和操作人员3个字段的内容，现要求统计从数据表的起始时间统计，每十分钟内，同一个操作人员操作次数，应该如何进行处理？
多条操作记录：

data = {'date': ['2022-01-01 00:00:01', '2022-01-01 00:16:00', '2022-01-01 00:32:00', '2022-01-01 00:15:00', '2022-01-01 06:11:00', '2022-01-01 10:15:00', '2022-01-01 12:22:00', '2022-01-01 14:00:00', '2022-01-01 17:34:00'],'name': [a,a,c,b,c,a,b,c,a]}

之前，通过学习其他博主的时间频率的统计方法，可以统计到，每十分钟内的操作次数，但是不知道该如何在此基础上拓展分组条件和设立频率计算的起始时间

custom_df = df.groupby(pd.Grouper(freq='10T')).count()

输出是这个的效果，仅为效果展示，数据没算哦：

date                 count
2022-01-01 00:00:00    1
2022-01-01 00:15:00    0
2022-01-01 00:30:00    1
.......

想要达到的效果是，仅为效果展示，数据没算哦：

date                    name       count 
2022-01-01 00:00:01      a          1
2022-01-01 00:15:01      a          2
2022-01-01 00:30:01      b          1
.......

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
GISer Liu 2024-02-06 11:41
关注
该回答引用自GPT-3.5,由博主GIS_Liu编写：

你可以使用以下方法来解决这个问题：

首先，将数据表转换为 pandas DataFrame：

import pandas as pd data = {'date': ['2022-01-01 00:00:01', '2022-01-01 00:16:00', '2022-01-01 00:32:00', '2022-01-01 00:15:00', '2022-01-01 06:11:00', '2022-01-01 10:15:00', '2022-01-01 12:22:00', '2022-01-01 14:00:00', '2022-01-01 17:34:00'], 'name': ['a', 'a', 'c', 'b', 'c', 'a', 'b', 'c', 'a']} df = pd.DataFrame(data) df['date'] = pd.to_datetime(df['date'])

然后，你可以使用groupby来按照每十分钟内的时间窗口和操作人员进行分组，并计算操作次数：

result = df.groupby([pd.Grouper(key='date', freq='10T'), 'name']).size().reset_index(name='count')

这将会得到一个新的 DataFrame result，包含每十分钟内，每个操作人员的操作次数。

如果你需要从数据表的起始时间开始统计，你可以添加一个新的列来记录时间窗口的起始时间：

result['start_time'] = result['date'].apply(lambda x: x - pd.Timedelta(minutes=x.minute % 10))

这将会为每个时间窗口添加一个起始时间的列。

最后，你可以按照你想要的格式重新排列 DataFrame，以达到你想要的效果：

result = result[['start_time', 'name', 'count']]

这样，你就得到了按时间窗口和操作人员进行分组统计的结果。

完整代码如下：

import pandas as pd data = {'date': ['2022-01-01 00:00:01', '2022-01-01 00:16:00', '2022-01-01 00:32:00', '2022-01-01 00:15:00', '2022-01-01 06:11:00', '2022-01-01 10:15:00', '2022-01-01 12:22:00', '2022-01-01 14:00:00', '2022-01-01 17:34:00'], 'name': ['a', 'a', 'c', 'b', 'c', 'a', 'b', 'c', 'a']} df = pd.DataFrame(data) df['date'] = pd.to_datetime(df['date']) result = df.groupby([pd.Grouper(key='date', freq='10T'), 'name']).size().reset_index(name='count') result['start_time'] = result['date'].apply(lambda x: x - pd.Timedelta(minutes=x.minute % 10)) result = result[['start_time', 'name', 'count']]

这个代码将会生成按时间窗口和操作人员进行分组统计的结果，并满足你的要求。希望对你有所帮助！如果还有其他问题，请随时提问。![img](https://userblink.csdnimg.cn/direct/3281b502cb5447e0aa06db9ebdf7f434.png
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

pandas库专为Python编程语言设计的强大的数据处理和分析库介绍文档
2024-07-02 12:36

- **时间序列分析**：提供了处理时间序列数据的功能，如频率转换、移动窗口统计等。 - **缺失值处理**：能够方便地处理数据集中的缺失值。 - **数据透视表**：创建复杂的多维度透视表，帮助进行数据分析。 - **统计...
Python代码源码-实操案例-框架案例-处理时间频率问题.zip
2024-02-22 18:54

在Python编程语言中，处理时间频率问题是一项常见的任务，尤其在数据分析、日志记录、定时任务和时间序列分析等场景中。本压缩包文件“Python代码源码-实操案例-框架案例-处理时间频率问题.zip”包含了针对这类问题...
python log文件按时间统计_10分钟教你Python语言分析日志中对应时间、关键字数量...
2021-02-02 23:28

杨松圣的博客本文主要向大家介绍了Python语言分析日志中对应时间、关键字数量，通过具体的代码向大家展示，希望对大家学习Python语言有所帮助。#!/usr/bin/python#-*-coding:-utf-8-*-importtimeimportre#定义时间格式date_now=...
Python和R语言应用案例，提供1年的图书馆借阅数据，并进行大数据分析
2024-05-10 10:44

在本案例中，我们将探讨如何使用Python和R语言对一年的图书馆借阅数据进行大数据分析。这两种编程语言在数据科学领域都有广泛的应用，各有优势，且可以相互补充。以下是涉及的知识点： 1. **Python**: Python是数据...
Python进行描述性统计数据分析
2022-05-17 13:20

Mr数据杨的博客在大数据和人工智能时代，数据科学和...使用两种主要方法：可以将描述性统计应用于一个或多个数据集或变量。当描述和总结单个变量时，执行单变量分析。当搜索一对变量之间的统计关系时，进行双变量分析。同样多变量分
B站 Python Pandas 数据分析，编程练习100例
2022-02-25 16:09

8. **时间序列分析**：Pandas内置了对时间序列数据的支持，可以方便地处理日期和时间相关的操作，如`pd.to_datetime()`转换字符串为日期，`df.resample()`进行时间频率的重采样。 9. **数据合并与连接**：`merge()`...
Python爬取国家水稻信息进行数据分析可视化
2025-01-05 08:28

Python爬取国家水稻信息进行数据分析可视化的知识点包含了网络数据爬取、数据分析和数据可视化等多个方面，是一个综合性较强的项目。首先，项目报告部分应当对整个项目的目标、实施步骤、遇到的问题及解决方法、项目...
python数据分析——数据分类汇总与统计
2024-06-30 18:41

鲜于言悠905的博客 Python作为一种高效、简洁且易于学习的编程语言，在数据分析领域展现出了强大的实力。本文将介绍如何使用Python进行数据分类汇总与统计，帮助读者更好地理解和应用数据。首先，我们需要导入一些常用的Python库，如...
Python+pandas使用分裂与分组统计频次
2021-07-24 17:40

dongfuguo的博客中国大学MOOC“Python程序设计基础”第4次开课推荐图书：《Python程序设计（第3版）》，（ISBN：978-7-302-55083-9），董付国，清华大学出版社，2020年6月...
【Python 千题 —— 算法篇】字符统计
2024-09-07 14:50

繁依Fanyi的博客使用：当我们需要频率统计的同时进行分类时，它提供了简洁的实现方式。正则表达式：适合需要复杂模式匹配和处理的场景，在处理特殊字符和规则时非常强大。无论采用哪种方式，字符统计是编程中的一项基础技能，尤其在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月6日

求python多条件按时间频率进行分组统计方法

3条回答 默认 最新

问题事件

3条回答默认最新