python报错：KeyError: 'user_id'

#coding:utf-8
import pandas as pd
import numpy as np
import time
import datetime
import gc
from sklearn.preprocessing import LabelEncoder,OneHotEncoder

def pre_process(data):

cols = data.columns.tolist()
keys = ['instance_id', 'day']
for k in keys:
    cols.remove(k)

return data, cols

def dorollWin(data):

data['context_timestamp_str'] = data['context_timestamp'].astype(str)
user_time_join = data.groupby(test.user_id)['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index()
user_time_join.rename(columns={'context_timestamp_str':'user_time_join'},inplace = True)
data = pd.merge(data,user_time_join,on=[test.user_id],how='left')
user_shop_time_join = data.groupby([test.user_id,'shop_id'])['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index()
user_shop_time_join.rename(columns={'context_timestamp_str':'user_shop_time_join'},inplace = True)
data = pd.merge(data,user_shop_time_join,on=[test.user_id,'shop_id'],how='left')
user_item_time_join = data.groupby([test.user_id,'item_id'])['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index()
user_item_time_join.rename(columns={'context_timestamp_str':'user_item_time_join'},inplace = True)
data = pd.merge(data,user_item_time_join,on=[test.user_id,'item_id'],how='left')
data['index_']=data.index
del user_time_join,user_shop_time_join,user_item_time_join

nowtime=data.context_timestamp.values
user_time=data.user_time_join.values
user_shop_time=data.user_shop_time_join.values
user_item_time=data.user_item_time_join.values

data_len=data.shape[0]
user_time_10_bf=np.zeros(data_len)
user_time_10_af=np.zeros(data_len)
user_shop_time_10_bf=np.zeros(data_len)
user_shop_time_10_af=np.zeros(data_len)
user_item_time_10_bf=np.zeros(data_len)
user_item_time_10_af=np.zeros(data_len)
a=time.time()
for i in range(data_len):
    df1=nowtime[i]
    df2=user_time[i].split(';')
    df2_len=len(df2)
    for j in range(df2_len):
        if ((int(df2[j])-df1)<600) & ((int(df2[j])-df1)>0):
            user_time_10_bf[i]+=1
        if ((int(df2[j])-df1)>-600) & ((int(df2[j])-df1)<0):
            user_time_10_af[i]+=1

    df3=user_shop_time[i].split(';')
    df3_len=len(df3)
    for j in range(df3_len):
        if ((int(df3[j])-df1)<600) & ((int(df3[j])-df1)>0):
            user_shop_time_10_bf[i]+=1
        if ((int(df3[j])-df1)>-600) & ((int(df3[j])-df1)<0):
            user_shop_time_10_af[i]+=1

    df4=user_item_time[i].split(';')
    df4_len=len(df4)
    for j in range(df4_len):
        if ((int(df4[j])-df1)<600) & ((int(df4[j])-df1)>0):
            user_item_time_10_bf[i]+=1
        if ((int(df4[j])-df1)>-600) & ((int(df4[j])-df1)<0):
            user_item_time_10_af[i]+=1

print(time.time()-a)

data['user_count_10_bf']=user_time_10_bf
data['user_count_10_af']=user_time_10_af
data['user_shop_count_10_bf']=user_shop_time_10_bf
data['user_shop_count_10_af']=user_shop_time_10_af
data['user_item_count_10_bf']=user_item_time_10_bf
data['user_item_count_10_af']=user_item_time_10_af

drops = ['context_timestamp_str', 'user_time_join', 'user_shop_time_join',
   'user_item_time_join', 'index_']
data = data.drop(drops, axis=1)

return data

def doSize(data):

add = pd.DataFrame(data.groupby(["shop_id", "day"]).item_id.nunique()).reset_index()
add.columns = ["shop_id", "day", "shop_item_unique_day"]
data = data.merge(add, on=["shop_id", "day"], how="left")

user_query_day = data.groupby(['user_id', 'day']).size().reset_index().rename(columns={0: 'user_id_query_day'})
data = pd.merge(data, user_query_day, how='left', on=['user_id', 'day'])

data['min_10'] = data['minute'] // 10
data['min_15'] = data['minute'] // 15
data['min_30'] = data['minute'] // 30
data['min_45'] = data['minute'] // 45

# user 不同时间段点击次数
min10_user_click = data.groupby(['user_id', 'day', 'hour', 'min_10']).size().reset_index().rename(columns={0:'min10_user_click'})
min15_user_click = data.groupby(['user_id', 'day', 'hour', 'min_15']).size().reset_index().rename(columns={0:'min15_user_click'})
min30_user_click = data.groupby(['user_id', 'day', 'hour', 'min_30']).size().reset_index().rename(columns={0:'min30_user_click'})
min45_user_click = data.groupby(['user_id', 'day', 'hour', 'min_45']).size().reset_index().rename(columns={0:'min45_user_click'})

data = pd.merge(data, min10_user_click, 'left', on=['user_id', 'day', 'hour', 'min_10'])
data = pd.merge(data, min15_user_click, 'left', on=['user_id', 'day', 'hour', 'min_15'])
data = pd.merge(data, min30_user_click, 'left', on=['user_id', 'day', 'hour', 'min_30'])
data = pd.merge(data, min45_user_click, 'left', on=['user_id', 'day', 'hour', 'min_45'])

del data['min_10']
del data['min_15']
del data['min_30']
del data['min_45']

return data

def doElse(data):

pass

def main():
path = 'F:/18ijcaidata/'

train = pd.read_csv(path+'train_day7.csv',encoding='utf-8')   
    test = pd.read_csv(path+'test_day7.csv',encoding='utf-8')
data = pd.concat([train, test])
print('初始维度:', data.shape)

data, cols = pre_process(data)
print('pre_process:', data.shape)

##################################
data = dorollWin(data)
print('dorollWin:', data.shape)

data = doSize(data)
print('doSize:', data.shape)
##################################

data = data.drop(cols, axis=1)

# 得到7号训练集
data = data.loc[data.day == 7]
data = data.drop('day', axis=1)
print('经过处理后,7号数据集最终维度::',data.shape)
print(data.columns.tolist())
data.to_csv(path+'103_statistics_feat.csv', index=False)

if name == '__main__': #??????????????运行此行，出现key error:'user_id'
main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_40893597 2019-03-20 19:41
关注
试试 dict.get[user_id] 调试调试

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

anaconda激活虚拟环境、创建都报错 python
2022-07-07 14:45

回答 1 已采纳这篇文章：Anaconda虚拟环境配置踩坑也许有你想要的答案，你可以看看同时，你还可以查看手册：python- 创建虚拟环境中的内容
python词云出现KeyError问题 python 有问必答
2021-03-19 16:53

回答 3 已采纳就代码中词云图问题，一是代码中wordlist是一个生成器对象，需要遍历出来，文本分割是全分割，其中有很多标点符号和其他字符不是中文，需要对其进行筛选剔除。wl=' '.join([x for x i
运行结果及报错内容 print(dict_data['content']['out'])KeyError: 'content，如何解决？ python 有问必答
2021-12-17 11:11

回答 2 已采纳网站签名校验没有通过啊，没有得到正确的dict_data
python 报错keyerror_python,_python 爬取 KeyError，python - phpStudy
2020-12-11 11:19

weixin_39732825的博客 python 爬取 KeyErrorfrom html.parser import HTMLParserimport urllib.requestwith urllib.request.urlopen('https://www.python.org/events/python-events/') as url:content = url.read()html = content.decode...
Python keyerror python
2022-08-29 13:06

回答 6 已采纳你最后一组数组没有user这个key
Python Flask-SQLAlchemy创建数据库报错 flask python 数据库
2023-03-18 11:00

回答 3 已采纳参考GPT和自己的思路：根据错误信息显示，问题出在当前代码运行的环境上下文中没有应用程序上下文。建议您将 db.create_all() 这个代码包装在 app.app_context() 上下文管
生成条形码PyCharm 环境下可正常运行，利用Pyinstaller打包后系统报错OSError: cannot open resource，如何解决？(语言-python) python
2022-05-05 04:43

回答 3 已采纳我估计问题出在barcode.writer.FONT=os.path.join('AdobeGothicStd-Bold.otf')这一行，因为报错提示信息是关于字体的，而你使用的这个字体并不是系统默
conda小白创建python虚拟环境报错WARNING conda.exceptions:print_unexpected_error_report(1216)
2022-09-25 16:00

K-7535的博客写入conda create -n test python=3.8.1报错报错全文为 (base) C:\Users\Administrator>conda create -n test python=3.8.1 WARNING conda.exceptions:print_unexpected_error_report(1216): KeyError('pkgs_...
python json爬虫企业信息，为什么提示keyerror呢 python 有问必答
2021-09-01 13:03

回答 4 已采纳要添加Referer头，要不返回的是{'status': -1, 'msg': '非法操作'}内容，当然会出错。。。有帮助麻烦点个采纳【本回答右上角】，谢谢~~ import requests h
MAC M1芯片tensorflow下的fit报错Graph execution error: tensorflow 深度学习神经网络
2023-01-09 21:30

回答 5 已采纳版本不匹配要降级pip install tensorflow-metal==0.5.0pip install tensorflow-macos==2.9.0
爬网易新闻的评论，代码如下，遇到问题KeyError python 爬虫
2022-05-29 23:21

回答 4 已采纳你这个问题我没找到解决办法，但是你如果仅仅是为了获取评论数据，按照我的方法可以绕过你的问题取获取，我觉得这样简单的多，我这里测试过没发现报错 import requests import re imp
python连接hive读取数据并转为DataFrame时报错记录（报错：keyError：24）
2022-04-30 15:35

zkkkkkkkkkkkkk的博客目录一、连接hive并读取数据二、定位问题 ...报错信息如下：KeyError : 24 一、连接hive并读取数据表中存有两列数据：时间、日期。格式为int类型。现在需要将日期和时间拼接起来，读入到......
plotly制作绘图报错ValueError python 有问必答
2022-01-18 13:01

回答 2 已采纳 'layout'属性要求是一个字典键值对形式，你传入的是一个列表？取列表第一个元素，就传入了字典参数， [{'title': 'B站动画分区视频排行榜上硬币最多的视频', 'titlefont': {
spyder/conda安装包报错：conda info could not be constructed. KeyError: ‘pkgs_dirs‘
2022-08-04 10:46

石头变钻石？的博客 pip install安装报错，Spyder不管用。Windows conda ImportError: DLL load failed while importing shell
为什么会报错KeyError: 'User'
2020-04-05 13:24

人生苦短，我学拍森的博客 import itchat import requests itchat.auto_login(hotReload=True) apiUrl = "http://openapi.tuling123.com/openapi/api/v2" def get_info(message): data = { "key":"7ad120888a3d45fb843534a5aee4...
没有解决我的问题, 去提问

悬赏问题

¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 运筹学排序问题中的在线排序
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛

python报错：KeyError: 'user_id'

2条回答 默认 最新

悬赏问题

2条回答默认最新