请问用pandas包读取csv后绘制的hist图时如何修正数据? 5C
travel = pd.read_csv("travel insurance.csv", low_memory=False)
role=travel[travel["Age"]>=100]
print(role["Agency"])
lengh = len(pd.unique(role["Agency"]))
plt.hist(role["Agency"],lengh,facecolor='green',alpha=0.5)
plt.show()

我想通过以上代码找出特定条件下(AGE>=100)每个Agency出现的频率。但是得到的条形统计图如下所示
图片说明

图片出现很多细条,似乎每出现一次就画一道。打印role["Agency"]后得到下图所示的数据,是否会有影响啊?
图片说明

1个回答

你应该选取合适的图表类型来绘制统计图。比如说,你这个应该按照Agency分组统计,然后每个Agency一个直方图,而不是每个数据一条线。

你这么画,也没错,但是不直观。好比股票行情,你如果按照股票的名字作为x轴,股票的价格的总和作为y轴画图,也可以画,但是没有什么实际意义。因为在股票的场景中,人们不关心不同股票价格的绝对差,相反大家关心的是股票的价格随着时间的波动。

weixin_39017744
weixin_39017744 就是想按Agency分组统计,但是似乎哪里写错了搞成这样每个订单都单独画出来一条细线
3 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
pandas关于csv的读取和写入问题
1、利用pandas.read_csv读取数据后再用pandas.to_csv写入数据,在新写入的数据里,多出了一行是为什么呢?对比了一下读取的和写入的数据,差别在于,写入的数据在中间多出一行空白行。 ``` import pandas as pd train=pd.read_csv(r'F:\data1\train.tsv', sep='\t',header=0) train.to_csv(r'F:\data2\train2.tsv', encoding='utf_8_sig',sep='\t', header=False,index=True) ``` 读入的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642507_391031.png) 写入后的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642607_667954.png)
pandas 绘制盒图时怎么确定哪些数据绘制为离散点的
![图片说明](https://img-ask.csdn.net/upload/201607/18/1468846804_730684.png) 在用pandas展现数据时,一些数据在盒图中显示为了离散点。 ``` df_qs_hb[-60:][['dx_gwxz']].boxplot() plt.show() ``` 我的小白问题: pandan在绘制盒图时,是依据什么来确定哪些数据为离散点。
pandas读取csv文件时出现错误,没法完整读取最后一行
csv文件里最后一行有1025个数据 程序如下: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563353102_680413.png) 报错: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563353135_134754.png) 添加上'error_bad_line'后输出如下:其中最后一行本来应当有1025项。 ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563353253_686430.png) 添加‘engine='python'’后输出如下: ![图片说明](https://img-ask.csdn.net/upload/201907/17/1563353497_862802.png)
pandas如何显示全部数据而不是省略号
现用pandas读取数据并选取其中一行想要输出,但是输出过程中数据并未全部显示,中间的部分用省略号代替了,如何能让其显示全部数据?
请问Python中如何转化带有字符串的dataframe成纯数字dataframe?
这个问题出现在画热度图的时候,热度图似乎只读数字部分不认字符部分。用pandas包读取的csv数据文件有很多列都是字符,导致无法正常画出热度图。求个转化方法。字符全都是名字或者商品之类的,直接用数字唯一值代替字符唯一值就好。
pandas 读取excel文件出错
我用python pandas 的read__excel 读取 excel文件时出错 提示pandas中没有read__excel函数!我已经装了xlrd了[图片说明](https://img-ask.csdn.net/upload/201709/01/1504225882_553547.png)
pandas绘制折线图问题
![图片说明](https://img-ask.csdn.net/upload/202002/02/1580622103_624355.png) 为什么画的折线图是顶着y轴的,怎么可以留点距离![图片说明](https://img-ask.csdn.net/upload/202002/02/1580621891_854739.png) 我想要弄成第二张图这样的
请问如何将python中dataframe里的string全部转化为float?
用pandas读取csv后,做聚类的时候报错如下:could not convert string to float: 'CWT'。把csv里面的这个全都替换掉之后就会显示新别的string无法转换。请问如何一次全都转换成float?
pandas如何把一个csv中的所有数据合并到一列
rt 将所有行的数据变成一行 input 1 2 3 4 5 6 7 8 9 output 1 2 3 4 5 6 7 8 9
pandas如何根据一行数据,添加对应的行数据
请教大神,如何用pandas实现图片中的效果 ![图片说明](https://img-ask.csdn.net/upload/201909/09/1568037123_840972.png)
pandas如何实现缺失的行数据按上一行数据进行填充?
![图1:原始表格](https://img-ask.csdn.net/upload/201908/31/1567241120_445483.png) ![图2:实现的效果](https://img-ask.csdn.net/upload/201908/31/1567241470_237048.png) 如图1所示,黄色区域的数据为空,如何用pandas实现行数据的填充,填充后的效果如图2所示。
Python中pandas读取数据库engine=create_engine()可以多人使用一个连接吗?
pandas读取数据库需要用到create_engine ``` engine = create_engine('postgresql://user:password@ip:port/database') ``` 问:这里的engine是否可以做为全局变量所有用户连接进来不再创建连接直接使用engine呢? ``` dataframe = pd.read_sql('select * from table',engine) ``` 是否可能存在连接冲突的可能?
python使用pandas处理绘图问题
版本:python3.6、anaconda3(64bit) 电脑配置:i7 3.6HZ 8CPU/8G内存 问题描述:使用pandas成功获取SQL数据后,首先我用sql的一个测试库 只有10个数据绘制折线图成功;后用正式库里面有20W条数据,运行后 没有报警,也没有反应等了5分钟也没有。我想知道它有没有在处理,怎 么看(是前后加time语句吗?)还请大神指点 以下是引用的库 import pandas as pd import matplotlib as mb import matplotlib.pyplot as plt import pandas as pd import pymysql
为什么用pandas.csv后报错说我维度不对?
定义 train_batch_data = csv_data[list(range(0, 4))] label_data = csv_data[list(range(4,5))] 放数据进神经网络 sess.run(train_step, feed_dict={xs: train_batch_data.loc[i], ys: label_data.loc[i]}) train_batch_data.loc[i]的结果print出来以后的确是某一行的数据,莫非是要我 reform?
pandas 对csv增加一行一列并随机赋值的问题
在最后一列添加新的列,列名为wine; 添加的数据为随机正态分布,1/5的数据为1,剩余数据为-1; df['wine']=-1 ran1=random.sample(range(0,len(df)//5),len(df)//5)#随机产生行号 for i in ran1: df['wine'][ran1[i]]=1 #这里难道不是对wine列 ran1[i]行赋值为1吗, #我的结果为什么是前面全是1, 后面是-1啊 在最后一行之后添加一行,随机添加1/4的数据为1,剩余为-1; df.loc[len(df)] = -1 ran2=random.sample(range(0,df.shape[1]//4),df.shape[1]//4)#随机产生列号 for i in ran2: df[ran2[i]][df.shape[0]]=1#这里难道不是对最后一行,ran2[i]列赋值为1吗
pandas读取excel的中文列名时出现错误
```py path1='D:\experiment' xlsx_names = [x for x in os.listdir(path1) if x.endswith(".xlsx")] #读取以xlsx结尾的文件 print(xlsx_names) df_data = None for xlsx_name in xlsx_names: path=os.path.join(path1,xlsx_name) print(path) df = pd.read_excel(path, sheet_name='订单明细') print(df) print(df['客户所在城市(地级市)']) print(df['商品件数(件数)']) ``` KeyError: '客户所在城市(地级市)' 不能打印出来,有没有人知道怎么回事
pandas使用透明表后运行错误
data=pd.read_csv('xxx.csv',encoding='gbk') new_data=pd.pivot_table(data,values='时间序列',index='姓名') 运行后报如下错误:https://ask.csdn.net/my# for i in values: if i in values : if i not in data: raise keyError(i) TypeError:argument of type 'method' is not iterable. 是因为透明表的值域不能是时间序列吗?还是想要处理的数据没有存入透明表中?
Python,pandas的series数据格式转化问题
你好: 我的源数据格式为: ![图片说明](https://img-ask.csdn.net/upload/201811/13/1542099212_203444.jpg) 我想转化为的格式: ![图片说明](https://img-ask.csdn.net/upload/201811/13/1542099281_738098.jpg) 也就是说我想把源数据中每一个数据项中每一个数组中的数据取出来,单独组成一个series 请问pandas中有没有什么合适的方法? 当然一个个取出来然后用for也行,但效率太慢,除了这种方式还有其他方式么? 谢谢~
终于明白阿里百度这样的大公司,为什么面试经常拿ThreadLocal考验求职者了
点击上面↑「爱开发」关注我们每晚10点,捕获技术思考和创业资源洞察什么是ThreadLocalThreadLocal是一个本地线程副本变量工具类,各个线程都拥有一份线程私...
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
将代码部署服务器,每日早上定时获取到天气数据,并发送到邮箱。 也可以说是一个小人工智障。 思路可以运用在不同地方,主要介绍的是思路。
面试官问我:什么是消息队列?什么场景需要他?用了会出现什么问题?
你知道的越多,你不知道的越多 点赞再看,养成习惯 GitHub上已经开源 https://github.com/JavaFamily 有一线大厂面试点脑图、个人联系方式和人才交流群,欢迎Star和完善 前言 消息队列在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在消息队列的使用和原理方面对小伙伴们进行360°的刁难。 作为一个在互联网公司面一次拿一次Offer的面霸...
8年经验面试官详解 Java 面试秘诀
作者 |胡书敏 责编 | 刘静 出品 | CSDN(ID:CSDNnews) 本人目前在一家知名外企担任架构师,而且最近八年来,在多家外企和互联网公司担任Java技术面试官,前后累计面试了有两三百位候选人。在本文里,就将结合本人的面试经验,针对Java初学者、Java初级开发和Java开发,给出若干准备简历和准备面试的建议。 Java程序员准备和投递简历的实...
究竟你适不适合买Mac?
我清晰的记得,刚买的macbook pro回到家,开机后第一件事情,就是上了淘宝网,花了500元钱,找了一个上门维修电脑的师傅,上门给我装了一个windows系统。。。。。。 表砍我。。。 当时买mac的初衷,只是想要个固态硬盘的笔记本,用来运行一些复杂的扑克软件。而看了当时所有的SSD笔记本后,最终决定,还是买个好(xiong)看(da)的。 已经有好几个朋友问我mba怎么样了,所以今天尽量客观...
MyBatis研习录(01)——MyBatis概述与入门
MyBatis 是一款优秀的持久层框架,它支持定制化 SQL、存储过程以及高级映射。MyBatis原本是apache的一个开源项目iBatis, 2010年该项目由apache software foundation 迁移到了google code并改名为MyBatis 。2013年11月MyBatis又迁移到Github。
程序员一般通过什么途径接私活?
二哥,你好,我想知道一般程序猿都如何接私活,我也想接,能告诉我一些方法吗? 上面是一个读者“烦不烦”问我的一个问题。其实不止是“烦不烦”,还有很多读者问过我类似这样的问题。 我接的私活不算多,挣到的钱也没有多少,加起来不到 20W。说实话,这个数目说出来我是有点心虚的,毕竟太少了,大家轻喷。但我想,恰好配得上“一般程序员”这个称号啊。毕竟苍蝇再小也是肉,我也算是有经验的人了。 唾弃接私活、做外...
Python爬虫爬取淘宝,京东商品信息
小编是一个理科生,不善长说一些废话。简单介绍下原理然后直接上代码。 使用的工具(Python+pycharm2019.3+selenium+xpath+chromedriver)其中要使用pycharm也可以私聊我selenium是一个框架可以通过pip下载 pip installselenium -ihttps://pypi.tuna.tsinghua.edu.cn/simple/ ...
阿里程序员写了一个新手都写不出的低级bug,被骂惨了。
这种新手都不会范的错,居然被一个工作好几年的小伙子写出来,差点被当场开除了。
Java工作4年来应聘要16K最后没要,细节如下。。。
前奏: 今天2B哥和大家分享一位前几天面试的一位应聘者,工作4年26岁,统招本科。 以下就是他的简历和面试情况。 基本情况: 专业技能: 1、 熟悉Sping了解SpringMVC、SpringBoot、Mybatis等框架、了解SpringCloud微服务 2、 熟悉常用项目管理工具:SVN、GIT、MAVEN、Jenkins 3、 熟悉Nginx、tomca...
Python爬虫精简步骤1 获取数据
爬虫,从本质上来说,就是利用程序在网上拿到对我们有价值的数据。 爬虫能做很多事,能做商业分析,也能做生活助手,比如:分析北京近两年二手房成交均价是多少?广州的Python工程师平均薪资是多少?北京哪家餐厅粤菜最好吃?等等。 这是个人利用爬虫所做到的事情,而公司,同样可以利用爬虫来实现巨大的商业价值。比如你所熟悉的搜索引擎——百度和谷歌,它们的核心技术之一也是爬虫,而且是超级爬虫。 从搜索巨头到人工...
Python绘图,圣诞树,花,爱心 | Turtle篇
每周每日,分享Python实战代码,入门资料,进阶资料,基础语法,爬虫,数据分析,web网站,机器学习,深度学习等等。 公众号回复【进群】沟通交流吧,QQ扫码进群学习吧 微信群 QQ群 1.画圣诞树 import turtle screen = turtle.Screen() screen.setup(800,600) circle = turtle.Turtle()...
作为一个程序员,CPU的这些硬核知识你必须会!
CPU对每个程序员来说,是个既熟悉又陌生的东西? 如果你只知道CPU是中央处理器的话,那可能对你并没有什么用,那么作为程序员的我们,必须要搞懂的就是CPU这家伙是如何运行的,尤其要搞懂它里面的寄存器是怎么一回事,因为这将让你从底层明白程序的运行机制。 随我一起,来好好认识下CPU这货吧 把CPU掰开来看 对于CPU来说,我们首先就要搞明白它是怎么回事,也就是它的内部构造,当然,CPU那么牛的一个东...
破14亿,Python分析我国存在哪些人口危机!
一、背景 二、爬取数据 三、数据分析 1、总人口 2、男女人口比例 3、人口城镇化 4、人口增长率 5、人口老化(抚养比) 6、各省人口 7、世界人口 四、遇到的问题 遇到的问题 1、数据分页,需要获取从1949-2018年数据,观察到有近20年参数:LAST20,由此推测获取近70年的参数可设置为:LAST70 2、2019年数据没有放上去,可以手动添加上去 3、将数据进行 行列转换 4、列名...
web前端javascript+jquery知识点总结
1.Javascript 语法.用途 javascript 在前端网页中占有非常重要的地位,可以用于验证表单,制作特效等功能,它是一种描述语言,也是一种基于对象(Object)和事件驱动并具有安全性的脚本语言 ...
Python实战:抓肺炎疫情实时数据,画2019-nCoV疫情地图
今天,群里白垩老师问如何用python画武汉肺炎疫情地图。白垩老师是研究海洋生态与地球生物的学者,国家重点实验室成员,于不惑之年学习python,实为我等学习楷模。先前我并没有关注武汉肺炎的具体数据,也没有画过类似的数据分布图。于是就拿了两个小时,专门研究了一下,遂成此文。
听说想当黑客的都玩过这个Monyer游戏(1~14攻略)
第零关 进入传送门开始第0关(游戏链接) 请点击链接进入第1关: 连接在左边→ ←连接在右边 看不到啊。。。。(只能看到一堆大佬做完的留名,也能看到菜鸡的我,在后面~~) 直接fn+f12吧 <span>连接在左边→</span> <a href="first.php"></a> <span>←连接在右边</span> o...
在家远程办公效率低?那你一定要收好这个「在家办公」神器!
相信大家都已经收到国务院延长春节假期的消息,接下来,在家远程办公可能将会持续一段时间。 但是问题来了。远程办公不是人在电脑前就当坐班了,相反,对于沟通效率,文件协作,以及信息安全都有着极高的要求。有着非常多的挑战,比如: 1在异地互相不见面的会议上,如何提高沟通效率? 2文件之间的来往反馈如何做到及时性?如何保证信息安全? 3如何规划安排每天工作,以及如何进行成果验收? ...... ...
作为一个程序员,内存和磁盘的这些事情,你不得不知道啊!!!
截止目前,我已经分享了如下几篇文章: 一个程序在计算机中是如何运行的?超级干货!!! 作为一个程序员,CPU的这些硬核知识你必须会! 作为一个程序员,内存的这些硬核知识你必须懂! 这些知识可以说是我们之前都不太重视的基础知识,可能大家在上大学的时候都学习过了,但是嘞,当时由于老师讲解的没那么有趣,又加上这些知识本身就比较枯燥,所以嘞,大家当初几乎等于没学。 再说啦,学习这些,也看不出来有什么用啊!...
渗透测试-灰鸽子远控木马
木马概述 灰鸽子( Huigezi),原本该软件适用于公司和家庭管理,其功能十分强大,不但能监视摄像头、键盘记录、监控桌面、文件操作等。还提供了黑客专用功能,如:伪装系统图标、随意更换启动项名称和表述、随意更换端口、运行后自删除、毫无提示安装等,并采用反弹链接这种缺陷设计,使得使用者拥有最高权限,一经破解即无法控制。最终导致被黑客恶意使用。原作者的灰鸽子被定义为是一款集多种控制方式于一体的木马程序...
Python:爬取疫情每日数据
前言 目前每天各大平台,如腾讯、今日头条都会更新疫情每日数据,他们的数据源都是一样的,主要都是通过各地的卫健委官网通报。 以全国、湖北和上海为例,分别为以下三个网站: 国家卫健委官网:http://www.nhc.gov.cn/xcs/yqtb/list_gzbd.shtml 湖北卫健委官网:http://wjw.hubei.gov.cn/bmdt/ztzl/fkxxgzbdgrfyyq/xxfb...
这个世界上人真的分三六九等,你信吗?
偶然间,在知乎上看到一个问题 一时间,勾起了我深深的回忆。 以前在厂里打过两次工,做过家教,干过辅导班,做过中介。零下几度的晚上,贴过广告,满脸、满手地长冻疮。 再回首那段岁月,虽然苦,但让我学会了坚持和忍耐。让我明白了,在这个世界上,无论环境多么的恶劣,只要心存希望,星星之火,亦可燎原。 下文是原回答,希望能对你能有所启发。 如果我说,这个世界上人真的分三六九等,...
B 站上有哪些很好的学习资源?
哇说起B站,在小九眼里就是宝藏般的存在,放年假宅在家时一天刷6、7个小时不在话下,更别提今年的跨年晚会,我简直是跪着看完的!! 最早大家聚在在B站是为了追番,再后来我在上面刷欧美新歌和漂亮小姐姐的舞蹈视频,最近两年我和周围的朋友们已经把B站当作学习教室了,而且学习成本还免费,真是个励志的好平台ヽ(.◕ฺˇд ˇ◕ฺ;)ノ 下面我们就来盘点一下B站上优质的学习资源: 综合类 Oeasy: 综合...
雷火神山直播超两亿,Web播放器事件监听是怎么实现的?
Web播放器解决了在手机浏览器和PC浏览器上播放音视频数据的问题,让视音频内容可以不依赖用户安装App,就能进行播放以及在社交平台进行传播。在视频业务大数据平台中,播放数据的统计分析非常重要,所以Web播放器在使用过程中,需要对其内部的数据进行收集并上报至服务端,此时,就需要对发生在其内部的一些播放行为进行事件监听。 那么Web播放器事件监听是怎么实现的呢? 01 监听事件明细表 名...
3万字总结,Mysql优化之精髓
本文知识点较多,篇幅较长,请耐心学习 MySQL已经成为时下关系型数据库产品的中坚力量,备受互联网大厂的青睐,出门面试想进BAT,想拿高工资,不会点MySQL优化知识,拿offer的成功率会大大下降。 为什么要优化 系统的吞吐量瓶颈往往出现在数据库的访问速度上 随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢 数据是存放在磁盘上的,读写速度无法和内存相比 如何优化 设计...
Python新型冠状病毒疫情数据自动爬取+统计+发送报告+数据屏幕(三)发送篇
今天介绍的项目是使用 Itchat 发送统计报告 项目功能设计: 定时爬取疫情数据存入Mysql 进行数据分析制作疫情报告 使用itchat给亲人朋友发送分析报告 基于Django做数据屏幕 使用Tableau做数据分析 来看看最终效果 目前已经完成,预计2月12日前更新 使用 itchat 发送数据统计报告 itchat 是一个基于 web微信的一个框架,但微信官方并不允许使用这...
作为程序员的我,大学四年一直自学,全靠这些实用工具和学习网站!
我本人因为高中沉迷于爱情,导致学业荒废,后来高考,毫无疑问进入了一所普普通通的大学,实在惭愧???? 我又是那么好强,现在学历不行,没办法改变的事情了,所以,进入大学开始,我就下定决心,一定要让自己掌握更多的技能,尤其选择了计算机这个行业,一定要多学习技术。 在进入大学学习不久后,我就认清了一个现实:我这个大学的整体教学质量和学习风气,真的一言难尽,懂的人自然知道怎么回事? 怎么办?我该如何更好的提升自...
粒子群算法求解物流配送路线问题(python)
1.Matlab实现粒子群算法的程序代码:https://www.cnblogs.com/kexinxin/p/9858664.html matlab代码求解函数最优值:https://blog.csdn.net/zyqblog/article/details/80829043 讲解通俗易懂,有数学实例的博文:https://blog.csdn.net/daaikuaichuan/article/...
教你如何编写第一个简单的爬虫
很多人知道爬虫,也很想利用爬虫去爬取自己想要的数据,那么爬虫到底怎么用呢?今天就教大家编写一个简单的爬虫。 下面以爬取笔者的个人博客网站为例获取第一篇文章的标题名称,教大家学会一个简单的爬虫。 第一步:获取页面 #!/usr/bin/python # coding: utf-8 import requests #引入包requests link = "http://www.santostang....
前端JS初级面试题二 (。•ˇ‸ˇ•。)老铁们!快来瞧瞧自己都会了么
1. 传统事件绑定和符合W3C标准的事件绑定有什么区别? 传统事件绑定 <div onclick="">123</div> div1.onclick = function(){}; <button onmouseover=""></button> 注意: 如果给同一个元素绑定了两次或多次相同类型的事件,那么后面的绑定会覆盖前面的绑定 (不支持DOM事...
情人节来了,教你个用 Python 表白的技巧
作者:@明哥 公众号:Python编程时光 2020年,这个看起来如此浪漫的年份,你还是一个人吗? 难不成我还能是一条狗? 18年的时候,写过一篇介绍如何使用 Python 来表白的文章。 虽然创意和使用效果都不错,但有一缺点,这是那个exe文件,女神需要打开电脑,才有可能参与进来,进而被你成功"调戏”。 由于是很早期的文章了,应该有很多人没有看过。 没有看过的,你可以点击这里查看:用Pyt...
相关热词 c# 识别回车 c#生成条形码ean13 c#子控制器调用父控制器 c# 写大文件 c# 浏览pdf c#获取桌面图标的句柄 c# list反射 c# 句柄 进程 c# 倒计时 线程 c# 窗体背景色
立即提问