丹心傲雪 2020-02-11 12:20 采纳率: 0%
浏览 399

python数据处理时遇到如下问题

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import csv
import fileinput
import time
pd.options.display.max_columns=None

start = time.time()

data=pd.read_csv('C:\Users\丹心傲雪\Desktop\毕业论文冲鸭\1001-CD\1001-CD.txt') #The path of data file

data.columns=['carid','orderid','time','longitude','latitude'] #添加列标签
orderid_list=np.array(data['orderid'].drop_duplicates()) #订单号列表
columns=['carid','orderid','starttime','endtime','longitude','latitude']
data_bak = pd.DataFrame(columns=columns)
append_dic = {}
data_end_time = []
for i in range(len(orderid_list)):
order=data[data['orderid']==orderid_list[i]]#根据订单号筛选数据
order.sort_values("time",inplace=True) #对同一订单的时间进行排序
order=np.array(order) #将df转为array
for j in range(len(order[0])):
append_dic[columns[j]] = order[0][j]
append_dic['endtime'] = order[-1][2]
data_bak = data_bak.append([append_dic],ignore_index=True)

data_bak.to_csv('data.csv',index=False)

end = time.time()
print("运行时间:%.2f秒"%(end-start))


  • 写回答

1条回答 默认 最新

  • 放风喽 2020-02-11 16:31
    关注

    没有缩进,没有问题描述
    你让人怎么回答

    评论

报告相同问题?

悬赏问题

  • ¥15 求帮我调试一下freefem代码
  • ¥15 R语言Rstudio突然无法启动
  • ¥15 关于#matlab#的问题:提取2个图像的变量作为另外一个图像像元的移动量,计算新的位置创建新的图像并提取第二个图像的变量到新的图像
  • ¥15 改算法,照着压缩包里边,参考其他代码封装的格式 写到main函数里
  • ¥15 用windows做服务的同志有吗
  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图