小白进行数据处理练习。
在进行日期转换时候提示数据异常。
如下提示:
OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 6635-01-01 00:00:00
将数据导出到excel中发现,有三个异常数据:
正常数据截图如下:
练习阶段,不想使用手动excel删除,如果通过代码,请问如何操作。下附相关的代码。
#section2数据变换
#航空业需要LRFMC五个指标,具体参见原网页。
#其中L=LOAD_TIME-FFP_TIME,R=LAST_TO_END,F=FLIGHT_COUNT,M=SEG_KM_SUM,C=avg_discount.
#求L,需要日期相减求出间隔天数,然后除以30得出月数。
#进行时间格式的转换
#td=pd.to_datetime(airlinedata_selection['LOAD_TIME'])
#在做到这里的时候发现了数据异常
airlinedata_selection.to_excel('D:/Python/code/tmp/airlinedata_selection.xls')
#使用airlinedata_selection.to_excel('D:/Python/code/tmp/airlinedata_selection.xls')将数据导出后发现loadtime和ffptime里有非时间的数据,需要把他们清理出来
#开始清理
#请大神帮忙,小白没有C币啊,不知道有没有大神能看到