python: 如何将dataframe一列中的字典拆分成多列?

图1是我通过爬虫之后,收集到的数据格式。

图片说明

然后我用以下语句导入数据

import pandas as pd
df=pd.read_csv('C:\\cnki_data_thu.txt', delimiter = '\t', header = None)
df.columns = [ 'Composite']

图2是导入了数据之后的Dataframe

但是我想要让dataframe里面的每一列都是一个数据类型,而不是像现在这样是一个字典。

具体来说,我希望
让第一列是“title”,第二列是"author",第三列是"abstract"这样子,以此类推

1个回答

参考这篇:pandas 读取包含多个字典的txt数据文件
https://blog.csdn.net/qq_40837600/article/details/104580842

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python pandas dataframe 中数组的拆分

我现在经过pyhon的apply计算得到一组数组,然后拼接到每一行dataframe后面,现在想把数组拆分成多行dataframe但是前面的字段还要保持,类似于透视表那样,如果不用新建dataframe直接在原来基础上实现该怎么做,谢谢![图片](https://img-ask.csdn.net/upload/201701/11/1484129516_102.jpg)

Python如何实现Dataframe中一列中若干数字之和在另一列中相同金额的匹配?

有如下Dataframe: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969009_819250.png) 想实现的效果是(针对非零数字): 1) 找到Dr列和Cr列中一样的数字,输出相关数字所在行: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969082_346211.png) 2)找到Cr列中几个数字加起来等于Dr列中的某个数字的所有组合: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969112_494678.png) 没有穷举,类似是这样的效果... 关于第1个功能,我自己的思路如下: ``` for i in list(df['Cr']): if i == 0: continue if i in list(df['Dr']): df1 = df.iloc[np.flatnonzero(df['Dr'] == i)] df2 = df.iloc[np.flatnonzero(df['Cr'] == i)] df = pd.concat([df1,df2]) print(df) ``` 但是结果如下,不知道为何只显示出第1个匹配项: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969270_354632.png) 关于第2个功能...不知道我是否表达清楚了: 想要达到的效果类似于凑数字,想检查右列里是否有若干个数字加起来正好等于左列里的某一个数字,返回所有符合这个条件的组合。 比如左列第一个数字是10,先在右列找有没有10,没有的话从右列第1个数字开始往下加:先2个一组求和,看有没有等于10的,再3个一组求和,看有没有等于10的,再4个一组求和...这样一直循环下去 目前有一点思路是用itertools: ``` list_cr = list(df['Cr']) comb2 = itertools.combinations(list_cr, 2) result2 = [sum(i) for i in comb2] for i in result2: if i == 0: continue if i in list(df['Dr']): print(df.iloc[np.flatnonzero(df['Dr'] == i)]) ``` 但是不知道怎么做到按3个一组、4个一组这样继续循环下去... 刚学习Python的弱鸡一枚跪地求助各位大佬们!

如何用Python的pandas实现DataFrame行的拆分,或者其他方法也可以。

大致目标就是以'Freq'列的分号拆分行,'Cfg'列的值也按分号匹配拆分,由于 'Cfg'列的分号多于'Freq'列,多余分号后的数值忽略掉, Freq'列为空的话,'Cfg'列 也让它为空,或者不做处理。 原DataFrame创建代码 ``` import pandas as pd import numpy as np dict1 = {'MEID':['31102','31103','31104'], 'Freq':['','4.0 ','5.0;35.0;36.0'], 'Cfg':['10;30;40;60;70;70;70','10;30;40;60;70;70;70','10;30;40;60;70;70;70']} df1 = pd.DataFrame(dict1) print(df1) ``` 原DataFrame ``` MEID Freq Cfg 311302 10;30;40;60;70;70;70 311303 4.0 10;30;40;60;70;70;70 311304 5.0;35.0;36.0 10;30;40;60;70;70;70 ``` 目标DataFrame ``` MEID Freq Cfg 311302 311303 4.0 10 311304 5.0 10 311304 35.0 30 311304 36.0 40 ``` 为防止我文字没描述清楚,我把目标DF和原DF的数据关系用下图表示一下。 ![图片说明](https://img-ask.csdn.net/upload/201909/02/1567390472_582007.png)

AttributeError: 'DataFrame' object has no attribute 'itemtype'

脚本运行的时候出现了这个错误提示 我发现是数据库里没有itemtype的数据 有没有办法让dataframe没数据的显示为0,然后继续进行下去吗? 如果能够联系更好,我的QQ为269733076

python dataframe 如何将一列分为两列

我又一个table, 使用pandas读入,其中一列是字符串,例如’address‘列下面的地址是:Guangdong Shenzhen。 现在想要将这一列分为两列,即Guangdong和Shenzhen各一列,请问有什么快速的方法。 我使用了.loc[]的方式,但是速度太慢了,处理一行就要0.15s左右,而我的数据集有400W条记录。 谢谢大家。刚在CSDN提问,没有金币,还望大神不吝赐教。

dataframe转成字典特定格式

![图片说明](https://img-ask.csdn.net/upload/201903/21/1553148871_181606.png)

求助:python dataframe相同项的两行数相减,几个大神看来都说难

#求助:python dataframe相同项的两行数相减,几个大神看来都说难 数据如下图: ![图片说明](https://img-ask.csdn.net/upload/201909/20/1568972249_821101.jpg) 要求: 用python构成一个新dataframe,计算出相同Serialsnumber的Receive Date的差。(也就是说算出没部机收到日期的间隔天数) 急,请大神帮忙!!!! 问题补充: Serialsnumber不只两个是相同的,有写有三个或四个相同的,要求计算出最大和第二大的Receive Date的差值。补充数据如图: ![图片说明](https://img-ask.csdn.net/upload/201909/21/1569031111_932262.jpg)

python dataframe 用第一列数据修改index

我是一个python新手 我用pandas读取某个txt文件(包含两部分,一列时间,一列数据),我想试图将DataFrame变为以A列为index,另一列B为data的新的txtDF,但是我试了很多方法,要不就是index对了,但是数据没了,要不就是运行以后一点变化都没有,我知道这个问题应该是个很简单的问题,希望大家能帮我一下,谢谢!!! import numpy as np import pandas as pd txt = np.loadtxt(dataPath, delimiter = ', ') txtDF = pd.DataFrame(txt, columns = list('AB')) 第一列是"A",第二列分别是"B" txtTmp = pd.DataFrame(txtDF.iloc[:,1],index=txtDF.iloc[:,0]) 重新构造的结果就是index对了,但是所有数据都变成NaN 还有一种方法就是txtDF.set_index('A'), 但是写入csv之后还是原来的结构,index没有变

将dataframe中的两列数据转换成字典dic,结果竟然成这样?

df 为dataframe对象,包含'word', 'count'两列数据 result_dic = df.groupby('word')['count'].apply(lambda x:str(x)).to_dict() result_dic = df.groupby('word')['count'].apply(lambda x:x).to_dict() ## 这两个结果竟然完全不一样,第一个可以达到期望的效果,生成{key:value}的字典 ![图片说明](https://img-ask.csdn.net/upload/201909/10/1568085813_49642.png) ## # 而第二种生成的字典是{index:value}. ![图片说明](https://img-ask.csdn.net/upload/201909/10/1568085825_682393.png) 这是为什么呢,求解。

Python如何从Pandas的一个DataFrame中获得第一列的索引,匹配到另一个DataFrame第一列索引的对应行,并对这些行中每一列的数值求和?

请问大神,Python如何从Pandas的一个DataFrame(A)中获得第一列的索引,匹配到另一个DataFrame(B)第一列的对应行,并对这些行中每一列的数值求和?

在使用python的DataFrame新建一列时遇到问题

1cfame是frame的视图吗? 2请问是什么问题导致的,是因为在视图上创建新列cframe['os']引起的吗? 3请问解决这个问题的思路是怎样的,有哪些方法,哪个方法最优! 4那个tring 是这样写的吗?cframe.loc[:,'os']=....,但是这样写问题同样存在 ![图片说明](https://img-ask.csdn.net/upload/201805/03/1525341061_169454.png)

dataframe 多列运算形成新的列问题

有一个名为“df_source”的dataframe: ![图片说明](https://img-ask.csdn.net/upload/201909/25/1569374877_884320.jpg) 想新添加一列“result1”为前两列相除结果,使用如下代码实现: df_source.eval('result1 = total_owner_equities/good_will',inplace = True) 提示错误:TypeError: unsupported operand type(s) for /: 'object' and 'object' 不知道错在哪里 然后想要用apply结合匿名函数解决,代码如下: df_source["result1"]=df_source[[" total_owner_equities","good_will"]].apply(lambda x:x[" total_owner_equities"]+x["goodwill"],axis=1) 但是也提示错误了,可能是我的用法有问题吧,请帮忙看下如何解决,哪种方法都行哈

请问python中,如何抓取dataframe的列数和第n列的数据?

我以前用的都是 data['AttributeName']抓取某列的数据,想求个抓取列数第n列数据方法。

python 如何删除dataframe中的一个值

在行和列全部都保留的情况下,清空某一个格子, 或者给这个格子赋值NaN 1 2 3 A 100 200 0 B 101 0 301 C 102 202 302 这个时候希望把0删除,变成以下形式 1 2 3 A 100 200 NaN B 101 NaN 301 C 102 202 302 或者,总之就是完全把这个格子空出来,让他变成缺失值 1 2 3 A 100 200 B 101 301 C 102 202 302

python里将dataframe转成matrix后,为什么参数会变

data=pd.DataFrame(data_train) data_matrix=data.as_matrix() dataframe输出的: Diabetes 8.091600 0.041000 matrix输出的 ['Diabetes' 8.0916 0.040999999999999995] 为什么0.041000会变成0.040999999999999995?

python里dataframe的连乘处理

小弟刚接触python不久,卡在一个dataframe的数据处理问题上解决不了, 特来求救,谢谢大家! 我想在原来的dataframe最后加一列,这列等于前两列连乘的差,不晓得该怎么搞,大 致就是这样: 原本 df= a b 0 2 1 1 3 2 2 4 3 变成 df= a b c 0 2 1 1=2-1 1 3 2 4=2x3-1x2 2 4 3 18=2x3x4-1x2x3

如何用Python的pandas实现DataFrame列的字符串截取

,截取的数字特征为最右边一个"="的数值(不一定是一位数) ![图片说明](https://img-ask.csdn.net/upload/201908/30/1567145119_473025.png) ![图片说明](https://img-ask.csdn.net/upload/201908/30/1567145778_562110.png) 用DataFrame输出即可

python Dataframe获取一列数,每个数是前面几个数的和;看似简单,细思有点意思

原始数据和要求如下: ![图片说明](https://img-ask.csdn.net/upload/201909/22/1569141589_441055.png) 也就是说要求得到的二月份的数据是是原有的一二月的总和,三月份的数据是原有数据一二三月的总和,以此类推 恳请大神出手相助,看看用python怎么样把这列数据按要求弄出来,谢了

python如何对dataframe中行去重?

RT,自己随便写了个,显示错误为 ValueError: Can only compare identically-labeled DataFrame objects 但总感觉思路都错了....请指教一下 ``` import pandas as pd from pandas import DataFrame L=[] file=open('F:\\FCD\\实验文本.txt') a=file.readlines() for line in a: L.append(line.split(',')) data=pd.DataFrame(L) for i in range(len(data)): for u in range(len(data)): a=data[i:i+1] b=data[u:u+1] if u != i and a==b: data.drop(data.index[[i,i+1]],inplace=True) ```

大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了

大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

点沙成金:英特尔芯片制造全过程揭密

“亚马逊丛林里的蝴蝶扇动几下翅膀就可能引起两周后美国德州的一次飓风……” 这句人人皆知的话最初用来描述非线性系统中微小参数的变化所引起的系统极大变化。 而在更长的时间尺度内,我们所生活的这个世界就是这样一个异常复杂的非线性系统…… 水泥、穹顶、透视——关于时间与技艺的蝴蝶效应 公元前3000年,古埃及人将尼罗河中挖出的泥浆与纳特龙盐湖中的矿物盐混合,再掺入煅烧石灰石制成的石灰,由此得来了人...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

上班一个月,后悔当初着急入职的选择了

最近有个老铁,告诉我说,上班一个月,后悔当初着急入职现在公司了。他之前在美图做手机研发,今年美图那边今年也有一波组织优化调整,他是其中一个,在协商离职后,当时捉急找工作上班,因为有房贷供着,不能没有收入来源。所以匆忙选了一家公司,实际上是一个大型外包公司,主要派遣给其他手机厂商做外包项目。**当时承诺待遇还不错,所以就立马入职去上班了。但是后面入职后,发现薪酬待遇这块并不是HR所说那样,那个HR自...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

我说我不会算法,阿里把我挂了。

不说了,字节跳动也反手把我挂了。

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

为什么你不想学习?只想玩?人是如何一步一步废掉的

不知道是不是只有我这样子,还是你们也有过类似的经历。 上学的时候总有很多光辉历史,学年名列前茅,或者单科目大佬,但是虽然慢慢地长大了,你开始懈怠了,开始废掉了。。。 什么?你说不知道具体的情况是怎么样的? 我来告诉你: 你常常潜意识里或者心理觉得,自己真正的生活或者奋斗还没有开始。总是幻想着自己还拥有大把时间,还有无限的可能,自己还能逆风翻盘,只不是自己还没开始罢了,自己以后肯定会变得特别厉害...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发(16k)

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

你打算用Java 8一辈子都不打算升级到Java 14,真香

我们程序员应该抱着尝鲜、猎奇的心态,否则就容易固步自封,技术停滞不前。

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《经典算法案例》01-08:如何使用质数设计扫雷(Minesweeper)游戏

我们都玩过Windows操作系统中的经典游戏扫雷(Minesweeper),如果把质数当作一颗雷,那么,表格中红色的数字哪些是雷(质数)?您能找出多少个呢?文中用列表的方式罗列了10000以内的自然数、质数(素数),6的倍数等,方便大家观察质数的分布规律及特性,以便对算法求解有指导意义。另外,判断质数是初学算法,理解算法重要性的一个非常好的案例。

《Oracle Java SE编程自学与面试指南》最佳学习路线图(2020最新版)

正确选择比瞎努力更重要!

一文带你入门Java Stream流,太强了

两个星期以前,就有读者强烈要求我写一篇 Java Stream 流的文章,我说市面上不是已经有很多了吗,结果你猜他怎么说:“就想看你写的啊!”你看你看,多么苍白的喜欢啊。那就“勉为其难”写一篇吧,嘻嘻。 单从“Stream”这个单词上来看,它似乎和 java.io 包下的 InputStream 和 OutputStream 有些关系。实际上呢,没毛关系。Java 8 新增的 Stream 是为...

立即提问
相关内容推荐