请问用pandas包读取csv后绘制的hist图时如何修正数据? 5C
travel = pd.read_csv("travel insurance.csv", low_memory=False)
role=travel[travel["Age"]>=100]
print(role["Agency"])
lengh = len(pd.unique(role["Agency"]))
plt.hist(role["Agency"],lengh,facecolor='green',alpha=0.5)
plt.show()

我想通过以上代码找出特定条件下(AGE>=100)每个Agency出现的频率。但是得到的条形统计图如下所示
图片说明

图片出现很多细条,似乎每出现一次就画一道。打印role["Agency"]后得到下图所示的数据,是否会有影响啊?
图片说明

1个回答

你应该选取合适的图表类型来绘制统计图。比如说,你这个应该按照Agency分组统计,然后每个Agency一个直方图,而不是每个数据一条线。

你这么画,也没错,但是不直观。好比股票行情,你如果按照股票的名字作为x轴,股票的价格的总和作为y轴画图,也可以画,但是没有什么实际意义。因为在股票的场景中,人们不关心不同股票价格的绝对差,相反大家关心的是股票的价格随着时间的波动。

weixin_39017744
weixin_39017744 就是想按Agency分组统计,但是似乎哪里写错了搞成这样每个订单都单独画出来一条细线
5 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问