1.本人现有一个25*3000的excel,里面包含不同股票的收益率统计,列名包括所在板块、发行年份、公司类型,市值等。我想筛选出多个条件的收益率中位数,如竞价方式下2011-2019年创业板企业的每年收益率中位数和正收益的比重。
2.我写了段代码,它一直报错说(与]不匹配。我找了很久,始终没有找出问题。还请各位大神帮忙看看。
import xlrd
import pandas as pd
import xlwt
def median(data):
data = sorted(data) #先排序
size = len(data) #得到数列的长度
if size % 2 == 0: # 通过取余判断列表长度为偶数
medians = (data[size//2]+data[size//2-1])/2 #取排序后位于中间的两位数。
else: # 因为用2取取余,不是0,就是1,所以直接取中间值。也就是判断列表长度为奇数
medians = data[(size-1)//2] #奇数就是中间的数就是中位数。
return medians
df=pd.read_excel(r'd:\python and model\定增\定增收益分析统计.xlsx')
df1=df.iloc[:,8:24]
df2=df1[df1['定价方式']=='竞价']
A=[]
B=[]
for x in range(2010,2019):
nian=string(x)
zhengshouyi=[]
zhongshouyi=[]
zhengshouyi=(df2[(df2['所属板块']=='创业板')&(df2['发行年份']==nian)&(df2['定增收益率']>0)].count())/(df2[df2['发行年份']==nian.count())
zhongshouyi=median(df2[(df2['所属板块']=='创业板')&(df2['发行年份']==nian)]['定增收益率'])
for i in range(0,len(df2['发行年份']==nian))):
A.append(zhengshouyi[i])
B.append(zhongshouyi[i])
print(A)
print(B)