Syn_Wll 2022-08-30 13:22 采纳率: 80%
浏览 62
已结题

pandas处理csv筛选数据

问题遇到的现象和发生背景

一个5万条左右的数据(csv),数据表现形式如下:

trip_start_timetrip_end_timetrip duration
2022/6/16 16:45:012022/6/16 21:48:305:03:29
2021/8/28 0:23:152022/6/12 19:01:576930:38:42

数据是一个关于旅行时间的记录,有开始时间(trip_start_time),结束时间(trip_end_time)和实际旅程时长(trip duration),其中,实际旅程时长 = 结束时间 - 开始时间,现在只要实际旅程时长在10分钟到5小时的,其他全部视为异常值舍弃。

问题相关代码,请勿粘贴截图

import pandas as pd
df = pd.read_csv('seat_data_utf_8.csv')
df = df.loc[(df['trip duration'] >= '00:10:00') & (df['trip duration'] <= '05:00:00')]

运行结果及报错内容

运行结果显示0 rows * 23 columns,没有符合的条件行,但实际上是有的

我想要达到的结果

筛选出实际旅程在10分钟到5小时的代码

  • 写回答

3条回答 默认 最新

  • honestman_ 2022-08-30 13:40
    关注

    首先你要明确trip duration这一列是什么类型,然后根据类型去做比较

    img


    现在的类型比较乱,建议转换成时间戳去比较

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 9月7日
  • 已采纳回答 8月30日
  • 创建了问题 8月30日

悬赏问题

  • ¥15 鼠标右键,撤销删除 复制 移动,要怎样删除
  • ¥15 使用MATLAB进行余弦相似度计算加速
  • ¥15 服务器安装php5.6版本
  • ¥15 我想用51单片机和数码管做一个从0开始的计数表 我写了一串代码 但是放到单片机里面数码管只闪烁一下然后熄灭
  • ¥20 系统工程中,状态空间模型中状态方程的应用。请猛男来完整讲一下下面所有问题
  • ¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
  • ¥15 arcgis处理土地利用道路 建筑 林地分类
  • ¥20 使用visual studio 工具用C++语音,调用openslsx库读取excel文件的sheet问题
  • ¥100 寻会做云闪付tn转h5支付链接的技术
  • ¥15 DockerSwarm跨节点无法访问问题