我想要将port of registry中的port进行统计,统计出不同port出现的次数,然后排列出出现最多的前20个港口,并用这21个港口的数据画图,横坐标是港口的名称,纵坐标是出现的次数,但我不知道该怎么写
下图是数据表
以下是用sqlite创建表并往表内填充数据的操作
想请教以下我该如何实现上述操作。
我想要将port of registry中的port进行统计,统计出不同port出现的次数,然后排列出出现最多的前20个港口,并用这21个港口的数据画图,横坐标是港口的名称,纵坐标是出现的次数,但我不知道该怎么写
下图是数据表
以下是用sqlite创建表并往表内填充数据的操作
想请教以下我该如何实现上述操作。
使用pandas处理得到需要可视化的列数据,然后用matplotlib作出频次的条形图。给你一个示例,应用你的数据时,将相关变量替换一下即可。
df1 = pd.DataFrame({'first_name': ['John', 'Anne', 'John', 'Beth'], 'middle_name': ['Smith', pd.NA, pd.NA, 'Louise']})
print(df1)
df2=df1['first_name'].value_counts(dropna=False).to_frame().rename(columns={'first_name':'first_name_counts'})
print(df2)
#df1['Port of Registry'].value_counts(dropna=False)[:20].to_frame()
import matplotlib.pyplot as plt
x=df2.index
y = df2['first_name_counts']
plt.bar(x,y,data=df2)
plt.show()