问题遇到的现象和发生背景
下面这个df中,第一列是订单id,第二列是时间,第三列是用户id,第四列及后面所有列都是我提取出来的特征矩阵,为1则表示该订单有这个特征,为0则表示没有这个特征。
我的诉求是,根据这个df,把每一列(也就是特征)做一个映射,规则是:1)若该元素的值为1则把订单的时间(也就是第二列)放过来,若该元素的值为0则不用理会还保持0就可。2)把时间数据映射过来之后,按照司机id分组,同一司机id下面同一列的时间数据汇总到一个列表中,可以看成是具有该项特征的时间序列,。
问题相关代码,请勿粘贴截图
运行结果及报错内容
现在只有大致的思路,尝试着修改特征值列的数据也一直报错,求指点!贴的图片只是数据中的一部分,一共有6w多条,所以最好也不用循环或者尽量时间复杂度低一点~~