用Python 将excel 导入Mysql 时遭遇报错: '<' not supported between instances of 'str' and 'int'

各位高手大家好:

在尝试使用Python语句将 工作用excel 导入本机的Mysql 时,需要将"EOL By"字段被Python识别成数字。
为了将其转化成可接受的日期型的形式,我使用了xlrd.xldate_as_datetime()的方法,随即报错: '<' not supported between instances of 'str' and 'int' 。 我想不明白:分明之前使用了同样方法的initiation date可以正常转化成日期型显示,而EOL By"字段就显示报错了

以下是我的代码:

import xlrd
import pymysql
import xlrd

# 打开excel----------------------------------------------------------
def open_excel():
    try:
        book = xlrd.open_workbook('C:/Users/lenovo/Desktop/工作纪录就靠它了.xlsx')  #文件名,把文件与py文件放在同一目录下
    except:
        print("open excel file failed!")
    try:
        sheet = book.sheet_by_name('ANZ纪录')   #execl里面的worksheet1
        return sheet
    except:
        print("locate worksheet in excel failed!")

# 验证:open_excel 是跑的通的
#-----------------------------------------------------------------


#连接数据库-------------------------------------------------------
try:
    db = pymysql.connect(host='localhost',user="root",
        passwd='QAZwsx12345678',
        db='test',
        charset='utf8')
except:
    print("could not connect to mysql server")
# 验证:本机数据库连接 是跑的通的
#----------------------------------------------------------------
def search_count():
    cursor = db.cursor()
    select = "select count(PN) from pn_infor" #获取表中xxxxx记录数
    cursor.execute(select) #执行sql语句
    line_count = cursor.fetchone()
    print(line_count[0])

#验证:search_count 是可以跑通的
#-----------------------------------------------------------------

def insert_deta():
    sheet = open_excel()
    cursor = db.cursor()
    for i in range(5, sheet.nrows): #第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1

        inidate = sheet.cell(i,0).value #取第i行第0列
        initiation_date = xlrd.xldate_as_datetime(inidate,0) # 把数字型的日期解码成真正的日期
        requestor = sheet.cell(i,1).value#取第i行第1列,下面依次类推
        EB  = sheet.cell(i,2).value
        EOL_By = initiation_date = xlrd.xldate_as_datetime(EB,0) # 把数字型的日期解码成真正的日期
        customer_name = sheet.cell(i,3).value
        Type_of_Service = sheet.cell(i,4).value
        PN = sheet.cell(i,5).value
        description30 = sheet.cell(i,6).value
        description80 = sheet.cell(i,7).value
        Enable = sheet.cell(i,8).value
        CostUSD = sheet.cell(i,9).value
        CostAUD = sheet.cell(i,10).value
        ListpriceAUD = sheet.cell(i,11).value
        DistipriceAUD = sheet.cell(i,12).value


        print(initiation_date)
        print(requestor)
        print(EOL_By)
        print(customer_name)
        print(Type_of_Service)
        print(PN)
        print(description30)
        print(description80)
        print(Enable)
        print(CostUSD)
        print(CostAUD)
        print(ListpriceAUD)
        print(DistipriceAUD)
        print("---------------")


        value = (initiation_date,requestor,EOL_By,customer_name,Type_of_Service,PN,description30,description80,Enable,CostUSD,CostAUD,ListpriceAUD,DistipriceAUD)
        print(value)
        sql = "INSERT INTO pn_infor(initiation_date,requestor,EOL_By,customer_name,Type_of_Service,PN,description30,description80,Enable,CostUSD,CostAUD,ListpriceAUD,DistipriceAUD)VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
        cursor.execute(sql,value) #执行sql语句
        db.commit()
    cursor.close() #关闭连接



insert_deta()

db.close()#关闭数据
print ("ok ")

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python+appium+夜神运行程序报错:Could not find a connected Android device.

在线等。。。。 请大神帮忙看看怎么解决: python+appium+夜神运行程序报错:Could not find a connected Android device. 夜神正常启动,appium也启动了。 代码: ``` from appium import webdriver import time # 字典 des={} des['platformName']='Android' des['platformVersion']='4.4' des['deviceName']='127.0.0.1:62001' des['appPackage']='com.android.settings' des['appActivity']='.Settings' driver=webdriver.Remote('http://localhost:4723/wd/hub',des) ele_list=driver.find_element_by_id('android:id/title') for i in ele_list: print(i.text) ``` appium报错: ![图片说明](https://img-ask.csdn.net/upload/201901/08/1546913185_602063.jpg)

selenium后台运行报错:Message: element not interactable

selenium在前台运行是正常的,但在后台静默运行就报错:selenium.common.exceptions.ElementNotInteractableException: Message: element not interactable 出错的代码是在菜单定位下,该菜单需要鼠标悬浮才能出现: menu = browser.find_element_by_xpath('//*[@id="9903000000"]') time.sleep(2) ActionChains(browser).move_to_element(menu).perform() browser.find_element_by_id('9903010400').click() 请各位大侠指导怎么弄才能保证 后台运行,谢谢。

cmd环境下运行python,导入pandas包,报错ImportError:C extension:

请教下,安装python后,环境变量也设置好了。用pip命令安装pandas和numpy 也都成功了。 但是在cmd环境下运行python命令,导入pandas包的时候,却报错: ImportError:C extension: No module named 'pandas._libs.tslibs.nattype' not built 重新用pip命令卸载了pandas,重装了下。。仍旧报错:(这次名称换成了conversion) ImportError:C extension: No module named 'pandas._libs.tslibs.conversion' not built 这个是什么原因? pandas版本0.24.2,numpy的版本1.16.3 ![图片说明](https://img-ask.csdn.net/upload/201905/15/1557901361_293706.png) ![图片说明](https://img-ask.csdn.net/upload/201905/15/1557901370_747149.png)

Python 使用 openpyxl 将Excel数据 导入MySQL数据库中

最近有个项目需要Python 的openpyxl 插件将Excel数据 导入MySQL数据库中,可是以前都没有接触过Python,所以是个小白。。 下面是Excel和代码 ![图片说明](https://img-ask.csdn.net/upload/201607/20/1468977366_889365.png) Python code: # -*- coding: utf-8 -*- from openpyxl.reader.excel import load_workbook as lw import pymysql db = pymysql.connect("localhost","root","1234","test") #地址,用户名,密码,数据库名 # 使用 cursor() 方法创建一个游标对象 cursor cursor = db.cursor() insert_sql = 'insert into employee (LAST_NAME, FIRST_NAME, AGE, SEX, INCOME) values (%s, %s, %s, %s, %s)' wb = lw(filename = 'c:\\test.xlsx') ws = wb.get_sheet_by_name(wb.get_sheet_names()[0]) # <worksheet "data"> rows = ws.max_row # 最大行数 columns = ws.max_column # 最大列数 data = [] for rx in range(1, rows+1): for cx in range(1, columns+1): data.append(str(ws.cell(row=rx, column=cx).value)) cursor.execute(insert_sql, (data[0], data[1], data[2], data[3], data[4])) data = [] db.commit() # 提交 # 关闭两个连接 cursor.close() db.close() ![图片说明](https://img-ask.csdn.net/upload/201607/20/1468977419_592032.jpg) 有一个问题就是,当excel表格里有中文的时候,代码运行就会报错: ![图片说明](https://img-ask.csdn.net/upload/201607/20/1468977385_365133.png) 网上试了很多解码的方法,都没能解决这个问题,而且,从mysql读数据的时候,print出来的中文显示是??(问号),也用了解码的代码了,但是没有解决。。求大神指点我这个小白。。感激不尽~~网上的各种方法都看过了,希望可以针对这个问题作出针对性的回答。 PS:Python 版本:3.5.2

python + Appium运行时,报错: A session is either terminated or not started 如何解决?

![图片说明](https://img-ask.csdn.net/upload/201911/30/1575119283_374195.png) # 代码如下: from appium import webdriver import time # #appium服务监听地址 server = 'http://localhost:4723/wd/hub' # localhost为本机;4723为端口(默认);/wd/hub可以看成是规定的默认地址 # #app启动参数 desired_caps = { "platformName": "Android", # platformName:使用哪个移动操作系统平台;iOS,Android或FirefoxOS # "platformVersion":"5", "deviceName": "127.0.0.1:62001", # deviceName:使用的移动设备或模拟器 "appPackage": "com.xcy.zj", # appPackage:填写包名 "appActivity": ".ui.activity.SplashActivity", # 要从包中启动的Android活动的活动名称 "newCommandTimeout" : 6000, "unicodeKeyboard" : True, "resetKeyboard" : True, "noReset": True } # #驱动 driver = webdriver.Remote(server, desired_caps) driver.implicitly_wait(10) ##点击我的 driver.find_element_by_id("com.xcy.zj:id/act_main_my_text").click() # 报错信息如下: Traceback (most recent call last): File "D:/ceshi/Pycharm/pycharm projects/init_/exercise/test20191130.py", line 19, in <module> driver.implicitly_wait(10) File "D:\ceshi\Python\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 912, in implicitly_wait 'implicit': int(float(time_to_wait) * 1000)}) File "D:\ceshi\Python\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute self.error_handler.check_response(response) File "D:\ceshi\Python\lib\site-packages\appium\webdriver\errorhandler.py", line 29, in check_response raise wde File "D:\ceshi\Python\lib\site-packages\appium\webdriver\errorhandler.py", line 24, in check_response super(MobileErrorHandler, self).check_response(response) File "D:\ceshi\Python\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response raise exception_class(message, screen, stacktrace) selenium.common.exceptions.InvalidSessionIdException: Message: A session is either terminated or not started

qiime2 导入fastq数据报错:

各位大佬好,这里是qiime2 萌新小白提问,望各位大佬多多指教。 背景:16S测序,公司返回已切除barcode及引物的双端数据(Miseq测序得到的是PE300双端序列数据),现需要在qiime2里 import data 数据格式: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563368344_19216.png) 我自己制作的manifest文件: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563368438_866486.png) 注:data是我存放测序数据的文件夹 代码: qiime tools import \ > --type 'SampleData[PairedEndSequencesWithQuality]' \ > --input-path se-33-manifest.csv \ > --output-path paired-end-demux.qza \ > --source-format PairedEndFastqManifestPhred33 报错: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563368790_397477.png) ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563368814_409062.png) 多谢指导!!

Python 报错: not enough values to unpack (expected 3, got 1),该怎么解决?求大神解决!

![图片说明](https://img-ask.csdn.net/upload/201910/22/1571745918_625213.png)![图片说明](https://img-ask.csdn.net/upload/201910/22/1571745931_336418.png) 代码如下: # -*- coding:utf-8 -*- import numpy as np import pandas as pd from collections import Counter from sklearn import preprocessing import scipy import sys import os path1=os.path.abspath('.') print(path1) name=pd.read_table("genotype.sav",header=0,sep=',') print(name) print(name.columns) for i in name.columns: a,b,c=Counter(name[i]).keys() if a[0]==a[1]: #print(keys[0],keys[1]) name[i].replace(a, 0, inplace=True) name[i].replace(b, 1, inplace=True) name[i].replace(c, 2, inplace=True) elif a[0]!=a[1]: name[i].replace(a, 1, inplace=True) name[i].replace(b, 0, inplace=True) name[i].replace(c, 2, inplace=True) #print(keys) #print(name[i]) name.to_csv('rename.csv') #recode_ID()

使用Python 语句将excel 自动导入本地Mysql数据表, 显示执行完毕,但Mysql 数据表中没有找到纪录

各位高手好: 在尝试着把之前自己的工作纪录导进本机建立的Mysql 数据库中 网上找到了某大神的代码: 如连接: https://www.cnblogs.com/longbigbeard/p/9309180.html 运行代码后显示运行成功,如图: ![图片说明](https://img-ask.csdn.net/upload/201904/29/1556513570_328017.png) 然而,当在MySQL 表格中复查的时候,发现数据库表格为空值(如图) ![图片说明](https://img-ask.csdn.net/upload/201904/29/1556513709_711636.png) 要导入的excel 表格截图如下:(好遗憾,似乎CSDN不能添加excel作为附件) ![图片说明](https://img-ask.csdn.net/upload/201904/29/1556514157_409812.png) 仿写代码如下:高手们知道问题出在那里么? ``` import xlrd import pymysql import xlrd # 打开excel---------------------------------------------------------- def open_excel(): try: book = xlrd.open_workbook('C:/Users/lenovo/Desktop/工作纪录就靠它了.xlsx') #文件名,把文件与py文件放在同一目录下 except: print("open excel file failed!") try: sheet = book.sheet_by_name('ANZ纪录') #execl里面的worksheet1 return sheet except: print("locate worksheet in excel failed!") # 验证:open_excel 是跑的通的 #----------------------------------------------------------------- #连接数据库------------------------------------------------------- try: db = pymysql.connect(host='localhost',user="root", passwd='QAZwsx12345678', db='test', charset='utf8') except: print("could not connect to mysql server") # 验证:本机数据库连接 是跑的通的 #---------------------------------------------------------------- def search_count(): cursor = db.cursor() select = "select count(PN) from pn_infor" #获取表中xxxxx记录数 cursor.execute(select) #执行sql语句 line_count = cursor.fetchone() print(line_count[0]) #验证:search_count 是可以跑通的 #----------------------------------------------------------------- def insert_deta(): sheet = open_excel() cursor = db.cursor() for i in range(5, sheet.nrows): #前5行是标题名,对应表中的字段名所以应该从第6行开始,计算机以0开始计数,所以值是6 inidate = sheet.cell(i,0).value #取第i行第0列 initiation_date = xlrd.xldate_as_datetime(inidate,0) # 把数字型的日期解码成真正的日期 requestor = sheet.cell(i,1).value#取第i行第1列,下面依次类推 EB = sheet.cell(i,2).value EOL_By = xlrd.xldate_as_datetime(EB,0) # 把数字型的日期解码成真正的日期 customer_name = sheet.cell(i,3).value Type_of_Service = sheet.cell(i,4).value PN = sheet.cell(i,5).value description30 = sheet.cell(i,6).value description80 = sheet.cell(i,7).value Enable = sheet.cell(i,8).value CostUSD = sheet.cell(i,9).value CostAUD = sheet.cell(i,10).value ListpriceAUD = sheet.cell(i,11).value DistipriceAUD = sheet.cell(i,12).value print(initiation_date) print(requestor) print(EOL_By) print(customer_name) print(Type_of_Service) print(PN) print(description30) print(description80) print(Enable) print(CostUSD) print(CostAUD) print(ListpriceAUD) print(DistipriceAUD) print("---------------") value = (initiation_date,requestor,EOL_By,customer_name,Type_of_Service,PN,description30,description80,Enable,CostUSD,CostAUD,ListpriceAUD,DistipriceAUD) print(value) sql = "INSERT INTO pn_infor(initiation_date,requestor,EOL_By,customer_name,Type_of_Service,PN,description30,description80,Enable,CostUSD,CostAUD,ListpriceAUD,DistipriceAUD)VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)" cursor.execute(sql,value) #执行sql语句 db.commit() cursor.close() #关闭连接 insert_deta() db.close()#关闭数据 print ("ok ") ```

pycharm编写django项目导入pymsql报错:ModuleNotFoundError: No module named 'pymysql'

我是在阿里云服务器上简历的Django 项目,然后通过pycharm下载下来进行编写的。还没开始写项目呢,配置settings时,我在pycharm上在init里面导入了pymysql,没报错。但是在服务器上runserver的时候就报错了。我是小白,现在不知道咋努力,没有思路,各位大佬帮我看看

python一个关于while循环的报错问题

girls = ['gujin','yangmi','zhengshuang'] my_girls = [] a = len(girls) a = int(a) while a >= 0: a=a-1 girl = girls.pop() my_girls.append(girl) continue for my_girl in my_girls: print(my_girl) 报错: Traceback (most recent call last): File "girls4.py", line 6, in <module> girl = girls.pop() IndexError: pop from empty list 这段执行不报错: girls = ['gujin','yangmi','zhengshuang'] my_girls = [] while girls: girl = girls.pop() my_girls.append(girl) for my_girl in my_girls: print(my_girl)

Python使用类装饰器出现报错:TypeError: test2() missing 1 required positional argument: 'b'

```python class Timer(object): def __init__(self, func): self.func = func def __call__(self, *args, **kwargs): print("权限验证成功...") result = self.func(*args, **kwargs) print("新添加退出成功提示...") return result class Test(object): @Timer def test2(self, a, b): # 需要参数的 c = a + b print("test2两个数的求和结果是:", c) t = Test() t.test2(2, 3) ``` 出现报错:TypeError: test2() missing 1 required positional argument: 'b' 为什么会出现selef必须传参呢,如果在test2上面添加@staticmethod删除selef参数将不会出现报错,但是这不符合装饰器的用法了,应该怎么改才能使得Test类不该任何代码的情况下加@Timer就能直接使用呢

monkeyrunner下跑Python3.6的代码老报错:no module named:com

最近在用Python 进行 Android 的自动化测试,Python 3.0之前可以通过 from com.android.monkeyrunner import MonkeyRunner 导入MonkryRunner方法的,但是在Python 3.6 中使用这种方法失败了,提示如下: Traceback (most recent call last): File "<pyshell#0>", line 1, in <module> from com.android.monkeyrunner import MonkeyRunner ImportError: No module named 'com'

运行python报错:TypeError: must be real number, not tuple

我从Excel中提取数据出来结果的是[22, 26, 36, 28, 35, 27, 30, 32, 38, 38, 32] 放到一个数组里,逐个取出来与自己定义的一个范围做比对,如果在范围内则pass,否则就fail但是一直报这个错:TypeError: must be real number, not tuple

python2.7安装sklearn报错:ImportError: DLL load failed

import sklearn 报错: Traceback (most recent call last): File "<pyshell#3>", line 1, in <module> import sklearn File "D:\Python27\lib\site-packages\scikit_learn-0.15.2-py2.7-win-amd64.egg\sklearn\__init__.py", line 38, in <module> from .base import clone File "D:\Python27\lib\site-packages\scikit_learn-0.15.2-py2.7-win-amd64.egg\sklearn\base.py", line 10, in <module> from scipy import sparse File "D:\Python27\lib\site-packages\scipy\sparse\__init__.py", line 182, in <module> from .csr import * File "D:\Python27\lib\site-packages\scipy\sparse\csr.py", line 15, in <module> from .sparsetools import csr_tocsc, csr_tobsr, csr_count_blocks, \ File "D:\Python27\lib\site-packages\scipy\sparse\sparsetools\__init__.py", line 5, in <module> from .csr import * File "D:\Python27\lib\site-packages\scipy\sparse\sparsetools\csr.py", line 26, in <module> _csr = swig_import_helper() File "D:\Python27\lib\site-packages\scipy\sparse\sparsetools\csr.py", line 22, in swig_import_helper _mod = imp.load_module('_csr', fp, pathname, description) ImportError: DLL load failed: %1 不是有效的 Win32 应用程序。 用的python2.7.9,我已经安装了numpy1.9.1,scipy0.12.0,sklearn0.15.1,这些都是支持64位系统的,遇到这个问题我该怎么办

python3调用opencv报错:TypeError: Expected Ptr<cv::UMat> for argument 'array'

## python3调用opencv报错:TypeError: Expected cv::UMat for argument 'array’ ``` def measure_object(image): gray = cv.cvtColor(image, cv.COLOR_RGBA2GRAY) ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_OTSU) print("ret:%s" % ret) cv.imshow("binary image", binary) contours, hireachy = cv.findContours(binary, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE) for contour in enumerate(contours): # area = cv.contourArea(contour) #得到第几个轮廓面积 x, y, w, h = cv.boundingRect(contour) #得到外接矩形的大小 #求取几何矩 mm = cv.moments(contour) # type(mm) cx = mm['m10']/mm['m00'] cy = mm['m01'] / mm['m00'] cv.circle(image, (np.int(cx), np.int(cy)), 3, (0, 0, 255), -1) cv.rectangle(image, (x, y), ((x+w), (y+h)), (0, 0, 255), 2) cv.imshow("measure_contours", image) print("-------hello python-------") src = cv.imread('pic\\sample2.jpg') # cv.namedWindow("input image", cv.WINDOW_AUTOSIZE) cv.imshow('sample2', src) measure_object(src) cv.waitKey(0) cv.destroyAllWindows() ``` ## 报错如下: ![图片说明](https://img-ask.csdn.net/upload/202003/27/1585264814_429069.jpg) 查询了cv.boundingRect() 方法是返回 四个参数没错,请教一下大神。

Ubuntu子系统安装node过程中出现./configure: 4: exec: python: not found问题

我按照网上教程正在Ubuntu子系统下安装node 先获取了源码: sudo git clone https://github.com/nodejs/node.git 然后修改权限:sudo chmod -R 755 node 然后创建编译文件:sudo ./configure 这里出现了问题:./configure: 4: exec: python: not found 但我在node文件夹下发现有configure这个文件,还有一个configure.py文件 然后我暂时忽略这个问题,执行后面步骤: sudo make 又出现了问题:sudo: make: command not found 不知道怎么回事?有人知道怎么解决吗?网上也没找到答案

初学python,请问这个切片操作报错的原因是什么?

对元组,列表和字符串这三中类型的数据进行切片操作,书中的一个切片操作的源代码如下: ``` #!/usr/bin/env python #-*- coding:utf-8 -*- tp = {'apple', 'banana', 'grape', 'orange'} l = ['apple', 'banana', 'grape', 'orange'] s = 'apple' print tp[: 3] print tp[3 :] print tp[1 : -1] print tp[:] print l[: 3] print l[3 :] print l[1 : -1] print l[:] print s[: 3] print s[3 :] print s[1 : -1] print s[:] ``` 在命令行下运行上面的代码,结果报错: ``` Traceback (most recent call last): File "032_sequence_slice.py", line 8, in <module> print tp[:3] TypeError: 'set' object has no attribute '__getitem__' ``` 这是为何呢?希望各位能不吝赐教,小弟感激不尽。

python报错:AttributeError: module 'curses' has no attribute 'wrapper'

windows平台 python3.7.0 在vscode下运行程序时 其中curses.wrapper(main)报错 ``` PS E:\dai ma\aaa> C:/Users/夏洛洛/AppData/Local/Programs/Python/Python37/python.exe "e:/dai ma/aaa/项目/2048.py" Traceback (most recent call last): File "e:/dai ma/aaa/项目/2048.py", line 219, in <module> curses.wrapper(main) AttributeError: module 'curses' has no attribute 'wrapper' ``` 查询了下这个错误,可能是文件名并没有发生冲突,但换文件名后并没有排除。难道是windows平台问题吗? 求解,感激不尽。

python报错:KeyError: 'user_id'

#coding:utf-8 import pandas as pd import numpy as np import time import datetime import gc from sklearn.preprocessing import LabelEncoder,OneHotEncoder def pre_process(data): cols = data.columns.tolist() keys = ['instance_id', 'day'] for k in keys: cols.remove(k) return data, cols def dorollWin(data): data['context_timestamp_str'] = data['context_timestamp'].astype(str) user_time_join = data.groupby(test.user_id)['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index() user_time_join.rename(columns={'context_timestamp_str':'user_time_join'},inplace = True) data = pd.merge(data,user_time_join,on=[test.user_id],how='left') user_shop_time_join = data.groupby([test.user_id,'shop_id'])['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index() user_shop_time_join.rename(columns={'context_timestamp_str':'user_shop_time_join'},inplace = True) data = pd.merge(data,user_shop_time_join,on=[test.user_id,'shop_id'],how='left') user_item_time_join = data.groupby([test.user_id,'item_id'])['context_timestamp_str'].agg(lambda x:';'.join(x)).reset_index() user_item_time_join.rename(columns={'context_timestamp_str':'user_item_time_join'},inplace = True) data = pd.merge(data,user_item_time_join,on=[test.user_id,'item_id'],how='left') data['index_']=data.index del user_time_join,user_shop_time_join,user_item_time_join nowtime=data.context_timestamp.values user_time=data.user_time_join.values user_shop_time=data.user_shop_time_join.values user_item_time=data.user_item_time_join.values data_len=data.shape[0] user_time_10_bf=np.zeros(data_len) user_time_10_af=np.zeros(data_len) user_shop_time_10_bf=np.zeros(data_len) user_shop_time_10_af=np.zeros(data_len) user_item_time_10_bf=np.zeros(data_len) user_item_time_10_af=np.zeros(data_len) a=time.time() for i in range(data_len): df1=nowtime[i] df2=user_time[i].split(';') df2_len=len(df2) for j in range(df2_len): if ((int(df2[j])-df1)<600) & ((int(df2[j])-df1)>0): user_time_10_bf[i]+=1 if ((int(df2[j])-df1)>-600) & ((int(df2[j])-df1)<0): user_time_10_af[i]+=1 df3=user_shop_time[i].split(';') df3_len=len(df3) for j in range(df3_len): if ((int(df3[j])-df1)<600) & ((int(df3[j])-df1)>0): user_shop_time_10_bf[i]+=1 if ((int(df3[j])-df1)>-600) & ((int(df3[j])-df1)<0): user_shop_time_10_af[i]+=1 df4=user_item_time[i].split(';') df4_len=len(df4) for j in range(df4_len): if ((int(df4[j])-df1)<600) & ((int(df4[j])-df1)>0): user_item_time_10_bf[i]+=1 if ((int(df4[j])-df1)>-600) & ((int(df4[j])-df1)<0): user_item_time_10_af[i]+=1 print(time.time()-a) data['user_count_10_bf']=user_time_10_bf data['user_count_10_af']=user_time_10_af data['user_shop_count_10_bf']=user_shop_time_10_bf data['user_shop_count_10_af']=user_shop_time_10_af data['user_item_count_10_bf']=user_item_time_10_bf data['user_item_count_10_af']=user_item_time_10_af drops = ['context_timestamp_str', 'user_time_join', 'user_shop_time_join', 'user_item_time_join', 'index_'] data = data.drop(drops, axis=1) return data def doSize(data): add = pd.DataFrame(data.groupby(["shop_id", "day"]).item_id.nunique()).reset_index() add.columns = ["shop_id", "day", "shop_item_unique_day"] data = data.merge(add, on=["shop_id", "day"], how="left") user_query_day = data.groupby(['user_id', 'day']).size().reset_index().rename(columns={0: 'user_id_query_day'}) data = pd.merge(data, user_query_day, how='left', on=['user_id', 'day']) data['min_10'] = data['minute'] // 10 data['min_15'] = data['minute'] // 15 data['min_30'] = data['minute'] // 30 data['min_45'] = data['minute'] // 45 # user 不同时间段点击次数 min10_user_click = data.groupby(['user_id', 'day', 'hour', 'min_10']).size().reset_index().rename(columns={0:'min10_user_click'}) min15_user_click = data.groupby(['user_id', 'day', 'hour', 'min_15']).size().reset_index().rename(columns={0:'min15_user_click'}) min30_user_click = data.groupby(['user_id', 'day', 'hour', 'min_30']).size().reset_index().rename(columns={0:'min30_user_click'}) min45_user_click = data.groupby(['user_id', 'day', 'hour', 'min_45']).size().reset_index().rename(columns={0:'min45_user_click'}) data = pd.merge(data, min10_user_click, 'left', on=['user_id', 'day', 'hour', 'min_10']) data = pd.merge(data, min15_user_click, 'left', on=['user_id', 'day', 'hour', 'min_15']) data = pd.merge(data, min30_user_click, 'left', on=['user_id', 'day', 'hour', 'min_30']) data = pd.merge(data, min45_user_click, 'left', on=['user_id', 'day', 'hour', 'min_45']) del data['min_10'] del data['min_15'] del data['min_30'] del data['min_45'] return data def doElse(data): pass def main(): path = 'F:/18ijcaidata/' train = pd.read_csv(path+'train_day7.csv',encoding='utf-8') test = pd.read_csv(path+'test_day7.csv',encoding='utf-8') data = pd.concat([train, test]) print('初始维度:', data.shape) data, cols = pre_process(data) print('pre_process:', data.shape) ################################## data = dorollWin(data) print('dorollWin:', data.shape) data = doSize(data) print('doSize:', data.shape) ################################## data = data.drop(cols, axis=1) # 得到7号训练集 data = data.loc[data.day == 7] data = data.drop('day', axis=1) print('经过处理后,7号数据集最终维度::',data.shape) print(data.columns.tolist()) data.to_csv(path+'103_statistics_feat.csv', index=False) if __name__ == '__main__': #??????????????运行此行,出现key error:'user_id' main() ``` ```

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

删库了,我们一定要跑路吗?

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。 在 mysql 数据库中,我们知道 binlog 日志记录了我们对数据库的所有操作,所以 binlog 日志就是我们自救的利器。 接下来就来开启程序员自救之路。 想要自救成功,binlog 这把利器一定要好,在自己之前,我们一定要确定我们有 binlog 这把利器,以下就是确保有 bi...

再不跳槽,应届毕业生拿的都比我多了!

跳槽几乎是每个人职业生涯的一部分,很多HR说“三年两跳”已经是一个跳槽频繁与否的阈值了,可为什么市面上有很多程序员不到一年就跳槽呢?他们不担心影响履历吗? PayScale之前发布的**《员工最短任期公司排行榜》中,两家码农大厂Amazon和Google**,以1年和1.1年的员工任期中位数分列第二、第四名。 PayScale:员工最短任期公司排行榜 意外的是,任期中位数极小的这两家公司,薪资...

我以为我学懂了数据结构,直到看了这个导图才发现,我错了

数据结构与算法思维导图

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

华为初面+综合面试(Java技术面)附上面试题

华为面试整体流程大致分为笔试,性格测试,面试,综合面试,回学校等结果。笔试来说,华为的难度较中等,选择题难度和网易腾讯差不多。最后的代码题,相比下来就简单很多,一共3道题目,前2题很容易就AC,题目已经记不太清楚,不过难度确实不大。最后一题最后提交的代码过了75%的样例,一直没有发现剩下的25%可能存在什么坑。 笔试部分太久远,我就不怎么回忆了。直接将面试。 面试 如果说腾讯的面试是挥金如土...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

上班一个月,后悔当初着急入职的选择了

最近有个老铁,告诉我说,上班一个月,后悔当初着急入职现在公司了。他之前在美图做手机研发,今年美图那边今年也有一波组织优化调整,他是其中一个,在协商离职后,当时捉急找工作上班,因为有房贷供着,不能没有收入来源。所以匆忙选了一家公司,实际上是一个大型外包公司,主要派遣给其他手机厂商做外包项目。**当时承诺待遇还不错,所以就立马入职去上班了。但是后面入职后,发现薪酬待遇这块并不是HR所说那样,那个HR自...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

外包程序员的幸福生活

今天给你们讲述一个外包程序员的幸福生活。男主是Z哥,不是在外包公司上班的那种,是一名自由职业者,接外包项目自己干。接下来讲的都是真人真事。 先给大家介绍一下男主,Z哥,老程序员,是我十多年前的老同事,技术大牛,当过CTO,也创过业。因为我俩都爱好喝酒、踢球,再加上住的距离不算远,所以一直也断断续续的联系着,我对Z哥的状况也有大概了解。 Z哥几年前创业失败,后来他开始干起了外包,利用自己的技术能...

现代的 “Hello, World”,可不仅仅是几行代码而已

作者 |Charles R. Martin译者 | 弯月,责编 | 夕颜头图 |付费下载自视觉中国出品 | CSDN(ID:CSDNnews)新手...

!大部分程序员只会写3年代码

如果世界上都是这种不思进取的软件公司,那别说大部分程序员只会写 3 年代码,恐怕就没有程序员这种职业。

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

HTTP与HTTPS的区别

面试官问HTTP与HTTPS的区别,我这样回答让他竖起大拇指!

程序员毕业去大公司好还是小公司好?

虽然大公司并不是人人都能进,但我仍建议还未毕业的同学,尽力地通过校招向大公司挤,但凡挤进去,你这一生会容易很多。 大公司哪里好?没能进大公司怎么办?答案都在这里了,记得帮我点赞哦。 目录: 技术氛围 内部晋升与跳槽 啥也没学会,公司倒闭了? 不同的人脉圈,注定会有不同的结果 没能去大厂怎么办? 一、技术氛围 纵观整个程序员技术领域,哪个在行业有所名气的大牛,不是在大厂? 而且众所...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

终于懂了TCP和UDP协议区别

终于懂了TCP和UDP协议区别

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

立即提问
相关内容推荐