问题遇到的现象和发生背景
在处理一个五万条数据的表格(csv文件格式),表格中记录了产品的开始使用时间,例如“2022/7/7 12:21:18”,和结束时间“2022/7/7 13:03:43”,还有一列是使用Excel自带的差值计算得到的,就是“实际使用产品时间 = 开始时间 - 结束时间”。现在由于表格中有异常值,比如实际使用时间大于12小时的(比如下表第二行),请问如何在这种情况下导入csv文件data.csv,并设置条件删除异常值?
开始时间 | 结束时间 | 实际使用产品时间 |
---|---|---|
2022/7/7 12:19:09 | 2022/7/7 13:03:43 | 0:44:34 |
2021/8/28 0:23:15 | 2022/6/12 19:01:57 | 6930:38:42 |
问题相关代码,请勿粘贴截图
for time in df['trip duration']:
time.split(":")
if int(time[0]) > 10:
我的解答思路和尝试过的方法
尝试使用pandas库和datetime模块,但没有思路
我想要达到的结果
求相关代码~