在data_2020基础上,按“行业名称”,计算每一个行业的上市公司数量
上述数据保存为一个2列的DataFrame,名为ind_size。第一列为“行业名称”,第二列为“公司数量”
da=data_2020['行业名称'].value_counts()
ind_size=da.astype(str).str.split(' ',1,expand=True).reset_index().rename(columns={0:'行业名称',1:'公司数量'})
在data_2020基础上,按“行业名称”,计算每一个行业的上市公司数量
上述数据保存为一个2列的DataFrame,名为ind_size。第一列为“行业名称”,第二列为“公司数量”
da=data_2020['行业名称'].value_counts()
ind_size=da.astype(str).str.split(' ',1,expand=True).reset_index().rename(columns={0:'行业名称',1:'公司数量'})
import pandas as pd
data = [[101, 236423, '2021-01'],
[101, 223387, '2021-02'],
[101, 2266387, '2021-03'],
[102, 397845, '2021-01'],
[101, 13387, '2021-06'],
[102, 138257, '2021-02'],
[103, 83475, '2021-01'],
[103, 83475, '2021-05'],
[103, 393475, '2021-02']]
df = pd.DataFrame(data=data, columns=['code', 'mv', 'date'])
da = df['code'].value_counts()
ds = da.to_frame(name = 'count')
ds.index.name = 'code'
ds = ds.reset_index(level = 0)
print(ds)
'''--result
code count
0 101 4
1 103 3
2 102 2
'''