【新手问题】如何将dataframe结构中的人名字符串拆分后统计出现次数

题主刚学pandas不久,遇到这个问题希望各位大大帮忙解决。
希望在一份电影数据表中统计重复出现次数前几位的演员名称,原始dataframe数据格式如下:
图片说明

这是想要进行字符串统计的cast序列内容图片说明

尝试使用了values_count()方法,没有效果

也尝试了Counter()方法,报错unhashed list

想知道如何正确运用分隔符把这些数据切成单个的字符串并存入列表的形式,再进行统计

还有想知道unhashed list报错的解决方法,网上只说了为什么但是好像查不到如何解决
谢谢各位大大
————————————————————————————————
补充一个新问题,同样与计数有关

图片说明

如何计算各个州的婴儿出生性别F和M的总和,想要绘制成并列条形图的形式,但是用duplicated()方法好像统计不出来,需要用自定义函数生成,想了半天没想通,希望大大们顺便支个招。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python pandas dataframe 中数组的拆分

我现在经过pyhon的apply计算得到一组数组,然后拼接到每一行dataframe后面,现在想把数组拆分成多行dataframe但是前面的字段还要保持,类似于透视表那样,如果不用新建dataframe直接在原来基础上实现该怎么做,谢谢![图片](https://img-ask.csdn.net/upload/201701/11/1484129516_102.jpg)

如何用Python的pandas实现DataFrame行的拆分,或者其他方法也可以。

大致目标就是以'Freq'列的分号拆分行,'Cfg'列的值也按分号匹配拆分,由于 'Cfg'列的分号多于'Freq'列,多余分号后的数值忽略掉, Freq'列为空的话,'Cfg'列 也让它为空,或者不做处理。 原DataFrame创建代码 ``` import pandas as pd import numpy as np dict1 = {'MEID':['31102','31103','31104'], 'Freq':['','4.0 ','5.0;35.0;36.0'], 'Cfg':['10;30;40;60;70;70;70','10;30;40;60;70;70;70','10;30;40;60;70;70;70']} df1 = pd.DataFrame(dict1) print(df1) ``` 原DataFrame ``` MEID Freq Cfg 311302 10;30;40;60;70;70;70 311303 4.0 10;30;40;60;70;70;70 311304 5.0;35.0;36.0 10;30;40;60;70;70;70 ``` 目标DataFrame ``` MEID Freq Cfg 311302 311303 4.0 10 311304 5.0 10 311304 35.0 30 311304 36.0 40 ``` 为防止我文字没描述清楚,我把目标DF和原DF的数据关系用下图表示一下。 ![图片说明](https://img-ask.csdn.net/upload/201909/02/1567390472_582007.png)

python: 如何将dataframe一列中的字典拆分成多列?

图1是我通过爬虫之后,收集到的数据格式。 ![图片说明](https://img-ask.csdn.net/upload/201905/26/1558848520_884892.jpg) 然后我用以下语句导入数据 ``` import pandas as pd df=pd.read_csv('C:\\cnki_data_thu.txt', delimiter = '\t', header = None) df.columns = [ 'Composite'] ``` 图2是导入了数据之后的Dataframe 但是我想要让dataframe里面的每一列都是一个数据类型,而不是像现在这样是一个字典。 具体来说,我希望 让第一列是“title”,第二列是"author",第三列是"abstract"这样子,以此类推

在使用dataframe.ReadCSV时指定分隔符

<div class="post-text" itemprop="text"> <p>I'm trying to figure out how to use <code>dataframe.LoadOptions</code> in the <a href="https://github.com/kniren/gota" rel="nofollow noreferrer">gota library</a> to specify a delimiter when reading the CSV file. </p> <pre><code>package main import ( "fmt" "github.com/kniren/gota/dataframe" "io/ioutil" "strings" ) func main() { content, _ := ioutil.ReadFile("/path/to/csv/file.csv") ioContent := strings.NewReader(string(content)) df := dataframe.ReadCSV(ioContent) fmt.Println(df) } </code></pre> <p>The dataframe.ReadCSV function takes an <code>options</code> variable of type *dataframe.LoadOptions</p> <p>I checked the definition for the dataframe.LoadOptions struct and found the following:</p> <pre><code>type LoadOption func(*loadOptions) type loadOptions struct { defaultType series.Type detectTypes bool hasHeader bool names []string nanValues []string delimiter rune types map[string]series.Type } </code></pre> <p>I'm new to Go and got stuck on this. First time I've come across a definition like this: <code>type LoadOption func(*loadOptions)</code></p> </div>

请问Python中如何转化带有字符串的dataframe成纯数字dataframe?

这个问题出现在画热度图的时候,热度图似乎只读数字部分不认字符部分。用pandas包读取的csv数据文件有很多列都是字符,导致无法正常画出热度图。求个转化方法。字符全都是名字或者商品之类的,直接用数字唯一值代替字符唯一值就好。

如何用Python的pandas实现DataFrame列的字符串截取

,截取的数字特征为最右边一个"="的数值(不一定是一位数) ![图片说明](https://img-ask.csdn.net/upload/201908/30/1567145119_473025.png) ![图片说明](https://img-ask.csdn.net/upload/201908/30/1567145778_562110.png) 用DataFrame输出即可

pandas中Dataframe中的操作问题

在一个Dataframe实例中,比如: ``` C2 = pd.DataFrame({'R':[1,2,1],'sum':[3,2,3]}) ``` 我想把 R=1和sum=3的那些数据中的sum值都改为8(假如说),代码该怎么写呢?? 可不可以用 ix和iloc实现??

pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查

如题 pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查 不知道pandas中有没有这样的函数

python dataframe 如何将一列分为两列

我又一个table, 使用pandas读入,其中一列是字符串,例如’address‘列下面的地址是:Guangdong Shenzhen。 现在想要将这一列分为两列,即Guangdong和Shenzhen各一列,请问有什么快速的方法。 我使用了.loc[]的方式,但是速度太慢了,处理一行就要0.15s左右,而我的数据集有400W条记录。 谢谢大家。刚在CSDN提问,没有金币,还望大神不吝赐教。

将dataframe中的两列数据转换成字典dic,结果竟然成这样?

df 为dataframe对象,包含'word', 'count'两列数据 result_dic = df.groupby('word')['count'].apply(lambda x:str(x)).to_dict() result_dic = df.groupby('word')['count'].apply(lambda x:x).to_dict() ## 这两个结果竟然完全不一样,第一个可以达到期望的效果,生成{key:value}的字典 ![图片说明](https://img-ask.csdn.net/upload/201909/10/1568085813_49642.png) ## # 而第二种生成的字典是{index:value}. ![图片说明](https://img-ask.csdn.net/upload/201909/10/1568085825_682393.png) 这是为什么呢,求解。

请问如何将python中dataframe里的string全部转化为float?

用pandas读取csv后,做聚类的时候报错如下:could not convert string to float: 'CWT'。把csv里面的这个全都替换掉之后就会显示新别的string无法转换。请问如何一次全都转换成float?

从dataframe中选出子表

![图片说明](https://img-ask.csdn.net/upload/202001/19/1579400135_984511.png) 这两种选择方式中,第一个为何加select,select功能是哪些 第二个中为何在内层用subset=,

DataFrame和Matrix互转,字段名称丢失的问题

R语言中,DataFrame和matrix互转时候,DataFrame原先的列标题容易丢失 比如,转换前,DF字段名A, B, C,转换成matrix,再转回来,DF字段名就变了(两次t操作) 这个问题,该怎么处理?

循环列表中几个小dataframe合并的疑问

问题已解决,多谢 我有一个列表: [ f1 f2 class 0 a z 11 2 c n 11 3 d r 11, f1 f2 class 1 a k 22 4 d y 22, f1 f2 class 5 c a 33] 其实就是包含三个小的dataframe的列表 三个小dataframe分别是:df11、df22、df33 ![图片说明](https://img-ask.csdn.net/upload/201908/06/1565060639_514196.jpg) 我现在想把他们变成以f1列为索引、横向排列的一个表格,效果就是这样: ![图片说明](https://img-ask.csdn.net/upload/201908/06/1565060932_841242.jpg) 然后我尝试了以下做法: df5 = pd.concat([df11.set_index('f1'),df22.set_index('f1'),df33.set_index('f1')],axis=1,join='outer') 成功得到以下结果: ![图片说明](https://img-ask.csdn.net/upload/201908/06/1565061203_250349.jpg) 现在,由于我待处理的dataframe其实有很多,所以需要循环处理这个列表,我是这么写的: for i in range(len(list2)): c = pd.concat([c, list2[i].set_index('f1')], axis=1, join='outer') c 得出想要的结果了,谢谢

python dataframe 用第一列数据修改index

我是一个python新手 我用pandas读取某个txt文件(包含两部分,一列时间,一列数据),我想试图将DataFrame变为以A列为index,另一列B为data的新的txtDF,但是我试了很多方法,要不就是index对了,但是数据没了,要不就是运行以后一点变化都没有,我知道这个问题应该是个很简单的问题,希望大家能帮我一下,谢谢!!! import numpy as np import pandas as pd txt = np.loadtxt(dataPath, delimiter = ', ') txtDF = pd.DataFrame(txt, columns = list('AB')) 第一列是"A",第二列分别是"B" txtTmp = pd.DataFrame(txtDF.iloc[:,1],index=txtDF.iloc[:,0]) 重新构造的结果就是index对了,但是所有数据都变成NaN 还有一种方法就是txtDF.set_index('A'), 但是写入csv之后还是原来的结构,index没有变

python里将dataframe转成matrix后,为什么参数会变

data=pd.DataFrame(data_train) data_matrix=data.as_matrix() dataframe输出的: Diabetes 8.091600 0.041000 matrix输出的 ['Diabetes' 8.0916 0.040999999999999995] 为什么0.041000会变成0.040999999999999995?

python pandas apply 原理求解,如何在dataframe 中将同一行的某个数值塞进df结构的一列?

有一个data frame结构,其中一列是data frame组成的,其他的列都是str或者数值之类的,如何将一行中str一类的塞入df里? 我试过apply,结果很诡异。。。 函数里print出来的结果是想要的,但是返回以后拿到的结果city就都是 tyu一个数值了 高手求解。。。 ``` import pandas as pd def testcc(df1): #tmpdf = df1 tmpdf = df1['c'] value = df1['a'] # value = 111 tmpdf['city']=value print(tmpdf) return tmpdf df1 = pd.DataFrame({'a': ['qwe'], 'b': ['asd']}) df4 =df1 df3 = pd.DataFrame({'a': ['qwe']}) df2 = pd.DataFrame({'a': ['qwe', 'wer', 'ert', 'rty', 'tyu'], 'b': ['asd', 'sdf', 'dfg', 'fgh', 'ghj'], 'c': [df1,df3,df4,df1,df1]}) df2['d']=df2.apply(testcc,axis=1) print('------------------') print(df2['d']) ``` 结果是 ``` a b city 0 qwe asd qwe a b city 0 qwe asd qwe a city 0 qwe wer a b city 0 qwe asd ert a b city 0 qwe asd rty a b city 0 qwe asd tyu ------------------ 0 a b city 0 qwe asd tyu 1 a city 0 qwe wer 2 a b city 0 qwe asd tyu 3 a b city 0 qwe asd tyu 4 a b city 0 qwe asd tyu Name: d, dtype: object ```

dataframe将某列数据变为column索引

有这样一个dataframe ![图片说明](https://img-ask.csdn.net/upload/201908/01/1564652527_966044.jpg) 能够发现是多只不同code股票在固定几个日期取出来的值列表,现在,我想把表格的构造改变一下,改编后的样子是: code /date 2017-09-30 2017-12-31 2018-03-31 ....... 000032 ssss sssss ssss 000063 000070 ..... 第三列total_owner_equity直接填充到表里就好了,请问怎么实现?

Python如何从Pandas的一个DataFrame中获得第一列的索引,匹配到另一个DataFrame第一列索引的对应行,并对这些行中每一列的数值求和?

请问大神,Python如何从Pandas的一个DataFrame(A)中获得第一列的索引,匹配到另一个DataFrame(B)第一列的对应行,并对这些行中每一列的数值求和?

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

Java基础知识面试题(2020最新版)

文章目录Java概述何为编程什么是Javajdk1.5之后的三大版本JVM、JRE和JDK的关系什么是跨平台性?原理是什么Java语言有哪些特点什么是字节码?采用字节码的最大好处是什么什么是Java程序的主类?应用程序和小程序的主类有何不同?Java应用程序与小程序之间有那些差别?Java和C++的区别Oracle JDK 和 OpenJDK 的对比基础语法数据类型Java有哪些数据类型switc...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

Intellij IDEA 实用插件安利

1. 前言从2020 年 JVM 生态报告解读 可以看出Intellij IDEA 目前已经稳坐 Java IDE 头把交椅。而且统计得出付费用户已经超过了八成(国外统计)。IDEA 的...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

总结了 150 余个神奇网站,你不来瞅瞅吗?

原博客再更新,可能就没了,之后将持续更新本篇博客。

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

魂迁光刻,梦绕芯片,中芯国际终获ASML大型光刻机

据羊城晚报报道,近日中芯国际从荷兰进口的一台大型光刻机,顺利通过深圳出口加工区场站两道闸口进入厂区,中芯国际发表公告称该光刻机并非此前盛传的EUV光刻机,主要用于企业复工复产后的生产线扩容。 我们知道EUV主要用于7nm及以下制程的芯片制造,光刻机作为集成电路制造中最关键的设备,对芯片制作工艺有着决定性的影响,被誉为“超精密制造技术皇冠上的明珠”,根据之前中芯国际的公报,目...

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

为什么你不想学习?只想玩?人是如何一步一步废掉的

不知道是不是只有我这样子,还是你们也有过类似的经历。 上学的时候总有很多光辉历史,学年名列前茅,或者单科目大佬,但是虽然慢慢地长大了,你开始懈怠了,开始废掉了。。。 什么?你说不知道具体的情况是怎么样的? 我来告诉你: 你常常潜意识里或者心理觉得,自己真正的生活或者奋斗还没有开始。总是幻想着自己还拥有大把时间,还有无限的可能,自己还能逆风翻盘,只不是自己还没开始罢了,自己以后肯定会变得特别厉害...

百度工程师,获利10万,判刑3年!

所有一夜暴富的方法都写在刑法中,但总有人心存侥幸。这些年互联网犯罪高发,一些工程师高技术犯罪更是引发关注。这两天,一个百度运维工程师的案例传遍朋友圈。1...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发(16k)

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《Oracle Java SE编程自学与面试指南》最佳学习路线图2020年最新版(进大厂必备)

正确选择比瞎努力更重要!

字节跳动面试官竟然问了我JDBC?

轻松等回家通知

面试官:你连SSO都不懂,就别来面试了

大厂竟然要考我SSO,卧槽。

实时更新:计算机编程语言排行榜—TIOBE世界编程语言排行榜(2020年6月份最新版)

内容导航: 1、TIOBE排行榜 2、总榜(2020年6月份) 3、本月前三名 3.1、C 3.2、Java 3.3、Python 4、学习路线图 5、参考地址 1、TIOBE排行榜 TIOBE排行榜是根据全世界互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、YouTube统计出排名数据。

立即提问
相关内容推荐