group by后的dataframe格式大小排序新列一列 5C

图片说明
如图,dataframe格式,“代码”列已经group,约有3000个不同代码,现希望对不同代码在同一天某列进行排序(eg:每一天的1值)。然后将排序新列一列在代码后(eg:代码60000的“1”列数值在每天的不同大小排序)
求教

1个回答

group by是多行聚合为一行,与需求不符。应该是选定若干排序字段,依次为代码,日期,1列。然后在客户端去重

NewBornboom
NewBornboom 然后在客户端怎样。。
大约一年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
pandas.dataframe 排序

对dataframe所有的行排序, PS:不是指定行排序........

dataframe 多列运算形成新的列问题

有一个名为“df_source”的dataframe: ![图片说明](https://img-ask.csdn.net/upload/201909/25/1569374877_884320.jpg) 想新添加一列“result1”为前两列相除结果,使用如下代码实现: df_source.eval('result1 = total_owner_equities/good_will',inplace = True) 提示错误:TypeError: unsupported operand type(s) for /: 'object' and 'object' 不知道错在哪里 然后想要用apply结合匿名函数解决,代码如下: df_source["result1"]=df_source[[" total_owner_equities","good_will"]].apply(lambda x:x[" total_owner_equities"]+x["goodwill"],axis=1) 但是也提示错误了,可能是我的用法有问题吧,请帮忙看下如何解决,哪种方法都行哈

Python如何从Pandas的一个DataFrame中获得第一列的索引,匹配到另一个DataFrame第一列索引的对应行,并对这些行中每一列的数值求和?

请问大神,Python如何从Pandas的一个DataFrame(A)中获得第一列的索引,匹配到另一个DataFrame(B)第一列的对应行,并对这些行中每一列的数值求和?

python dataframe 用第一列数据修改index

我是一个python新手 我用pandas读取某个txt文件(包含两部分,一列时间,一列数据),我想试图将DataFrame变为以A列为index,另一列B为data的新的txtDF,但是我试了很多方法,要不就是index对了,但是数据没了,要不就是运行以后一点变化都没有,我知道这个问题应该是个很简单的问题,希望大家能帮我一下,谢谢!!! import numpy as np import pandas as pd txt = np.loadtxt(dataPath, delimiter = ', ') txtDF = pd.DataFrame(txt, columns = list('AB')) 第一列是"A",第二列分别是"B" txtTmp = pd.DataFrame(txtDF.iloc[:,1],index=txtDF.iloc[:,0]) 重新构造的结果就是index对了,但是所有数据都变成NaN 还有一种方法就是txtDF.set_index('A'), 但是写入csv之后还是原来的结构,index没有变

python: 如何将dataframe一列中的字典拆分成多列?

图1是我通过爬虫之后,收集到的数据格式。 ![图片说明](https://img-ask.csdn.net/upload/201905/26/1558848520_884892.jpg) 然后我用以下语句导入数据 ``` import pandas as pd df=pd.read_csv('C:\\cnki_data_thu.txt', delimiter = '\t', header = None) df.columns = [ 'Composite'] ``` 图2是导入了数据之后的Dataframe 但是我想要让dataframe里面的每一列都是一个数据类型,而不是像现在这样是一个字典。 具体来说,我希望 让第一列是“title”,第二列是"author",第三列是"abstract"这样子,以此类推

python dataframe 如何将一列分为两列

我又一个table, 使用pandas读入,其中一列是字符串,例如’address‘列下面的地址是:Guangdong Shenzhen。 现在想要将这一列分为两列,即Guangdong和Shenzhen各一列,请问有什么快速的方法。 我使用了.loc[]的方式,但是速度太慢了,处理一行就要0.15s左右,而我的数据集有400W条记录。 谢谢大家。刚在CSDN提问,没有金币,还望大神不吝赐教。

如何给rdd/dataframe增加一个自增列?

如题 假设目前有一个dataframe转化过来的rdd a,b,c d,e,f g,h,i 现在我想增加一个自增列 1,a,b,c 2,d,e,f 3,g,h,i dataframe或者rdd形式的都可以 请问大佬们怎么实现?

Sql group by与order by 后面的列的问题

在我的student表中有sno,sname,sdept,sage 我直接这样写order by后面的列并没有在select后面答案是对的 select sno,sname from student order by sage desc; //没有问题 但是我用加上group by后,按照它报的错,order by后面的列必须要是在group by中出现的,这是为什么呢? select sname,sdept,ssex from student group by sname,sdept,ssex having sdept ='MA' and ssex = '女' order by sage; //有错 select sname,sdept,ssex from student group by sname,sdept,ssex having sdept ='MA' and ssex = '女' order by sname; //这样也没问题

Python如何实现Dataframe中一列中若干数字之和在另一列中相同金额的匹配?

有如下Dataframe: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969009_819250.png) 想实现的效果是(针对非零数字): 1) 找到Dr列和Cr列中一样的数字,输出相关数字所在行: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969082_346211.png) 2)找到Cr列中几个数字加起来等于Dr列中的某个数字的所有组合: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969112_494678.png) 没有穷举,类似是这样的效果... 关于第1个功能,我自己的思路如下: ``` for i in list(df['Cr']): if i == 0: continue if i in list(df['Dr']): df1 = df.iloc[np.flatnonzero(df['Dr'] == i)] df2 = df.iloc[np.flatnonzero(df['Cr'] == i)] df = pd.concat([df1,df2]) print(df) ``` 但是结果如下,不知道为何只显示出第1个匹配项: ![图片说明](https://img-ask.csdn.net/upload/201912/10/1575969270_354632.png) 关于第2个功能...不知道我是否表达清楚了: 想要达到的效果类似于凑数字,想检查右列里是否有若干个数字加起来正好等于左列里的某一个数字,返回所有符合这个条件的组合。 比如左列第一个数字是10,先在右列找有没有10,没有的话从右列第1个数字开始往下加:先2个一组求和,看有没有等于10的,再3个一组求和,看有没有等于10的,再4个一组求和...这样一直循环下去 目前有一点思路是用itertools: ``` list_cr = list(df['Cr']) comb2 = itertools.combinations(list_cr, 2) result2 = [sum(i) for i in comb2] for i in result2: if i == 0: continue if i in list(df['Dr']): print(df.iloc[np.flatnonzero(df['Dr'] == i)]) ``` 但是不知道怎么做到按3个一组、4个一组这样继续循环下去... 刚学习Python的弱鸡一枚跪地求助各位大佬们!

在使用python的DataFrame新建一列时遇到问题

1cfame是frame的视图吗? 2请问是什么问题导致的,是因为在视图上创建新列cframe['os']引起的吗? 3请问解决这个问题的思路是怎样的,有哪些方法,哪个方法最优! 4那个tring 是这样写的吗?cframe.loc[:,'os']=....,但是这样写问题同样存在 ![图片说明](https://img-ask.csdn.net/upload/201805/03/1525341061_169454.png)

python pandas group by以后 想根据某列count组中的最小值 去改变另外一列

![图片说明](https://img-ask.csdn.net/upload/201907/16/1563243313_938955.png) 比如想根据图里 count=3的组中 score最小的一行去修改另外一列的值

spark的dataframe中如何提取某一列数据的类型做判断?

例如: if ( df.select(列名).获取数据的类型 == String){ }

请问各位pandas中set_values对多列数据进行排序的问题

请问一下各位,这个地方我想对多列同时进行排序,写法按说没有任何问题,可是为什么最后的排序结果只针对by里面的第一个参数,后两列完全没按照我设好的False\True顺序排序呀。。 请问下是为什么,难道是我对sort_values()这个函数对多列进行排序存在误解。。 ``` frame = pd.DataFrame({'b':[4.,7,-3,2],'a':[0.,1,0,1],'c':[56,32,13.,2]}) frame = frame.sort_values(by = ['b','a','c'],ascending = [True,False,True]) frame ```

dataframe将某列数据变为column索引

有这样一个dataframe ![图片说明](https://img-ask.csdn.net/upload/201908/01/1564652527_966044.jpg) 能够发现是多只不同code股票在固定几个日期取出来的值列表,现在,我想把表格的构造改变一下,改编后的样子是: code /date 2017-09-30 2017-12-31 2018-03-31 ....... 000032 ssss sssss ssss 000063 000070 ..... 第三列total_owner_equity直接填充到表里就好了,请问怎么实现?

python中 dataframe使用permutation和take对 列 进行随机排序失败

请问python中 dataframe使用sampler和take对列进行随机排列为什么不行呢? import pandas as pd import numpy as np from pandas import DataFrame from pandas import Series df=DataFrame(np.arange(20).reshape(5,4)) sampler=np.random.permutation(5) print(df.take(sampler,axis=1)) **报错如下**: Traceback (most recent call last): File "C:\Users\XXXX\Desktop\test190109.py", line 7, in <module> print(df.take(sampler,axis=1)) File "C:\Users\XXXxx\AppData\Local\Programs\Python\Python36-32\lib\site-packages\pandas\core\generic.py", line 2891, in take return self._take(indices, axis=axis, is_copy=is_copy) File "C:\Users\XXXXX\AppData\Local\Programs\Python\Python36-32\lib\site-packages\pandas\core\generic.py", line 2789, in _take verify=True) File "C:\Users\XXXXXX\AppData\Local\Programs\Python\Python36-32\lib\site-packages\pandas\core\internals.py", line 4530, in take indexer = maybe_convert_indices(indexer, n) File "C:\Users\xxxxx\AppData\Local\Programs\Python\Python36-32\lib\site-packages\pandas\core\indexing.py", line 2480, in maybe_convert_indices raise IndexError("indices are out-of-bounds") IndexError: indices are out-of-bounds 目测是最后一行axis=1的问题?去掉了就能跑了

dataframe中插入列赋值后显示为空,但交互窗口单独显示列却不是空的,如何解决

df2=ts.get_k_data('600596',start='2010-07-20',end='2018-07-20') col=df2.columns.tolist() col.insert(col.index('close'),'zhangfu') zhangfu=df2.close/df2.close.shift(1)-1 df2.reindex(columns=col) 代码运行后整个zhangfu列都是NaN. 但如果直接print(zhangfu)则是有具体数字的。请问如何解决。

spark dataframe如何把一列由数组变成向量

我有一个Column,如下图 ![图片说明](https://img-ask.csdn.net/upload/201710/06/1507219668_258493.png) 这是一个数组,现在我想把这一列的数组转换成向量,请我应该怎么做。

如何用java实现SparkSQL dataframe添加自增序号列?

用spark分页查询数据,普通的sql()的不支持分页的sql语句 在网上查资料说可以增加一个序列实现 但是基本都是scala语言,代码如下 // 在原Schema信息的基础上添加一列 “id”信息 val schema: StructType = dataframe.schema.add(StructField("id", LongType)) // DataFrame转RDD 然后调用 zipWithIndex val dfRDD: RDD[(Row, Long)] = dataframe.rdd.zipWithIndex() val rowRDD: RDD[Row] = dfRDD.map(tp => Row.merge(tp._1, Row(tp._2))) // 将添加了索引的RDD 转化为DataFrame val df2 = spark.createDataFrame(rowRDD, schema) df2.show() 这段代码如何用java实现呢 或者说我想把dataframe的数据分行获取,有什么其他办法吗

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

总结了 150 余个神奇网站,你不来瞅瞅吗?

原博客再更新,可能就没了,之后将持续更新本篇博客。

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发(16k)

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《Oracle Java SE编程自学与面试指南》最佳学习路线图2020年最新版(进大厂必备)

正确选择比瞎努力更重要!

《Oracle Java SE编程自学与面试指南》最佳学习路线图(2020最新版)

正确选择比瞎努力更重要!

都前后端分离了,咱就别做页面跳转了!统统 JSON 交互

文章目录1. 无状态登录1.1 什么是有状态1.2 什么是无状态1.3 如何实现无状态1.4 各自优缺点2. 登录交互2.1 前后端分离的数据交互2.2 登录成功2.3 登录失败3. 未认证处理方案4. 注销登录 这是本系列的第四篇,有小伙伴找不到之前文章,松哥给大家列一个索引出来: 挖一个大坑,Spring Security 开搞! 松哥手把手带你入门 Spring Security,别再问密...

字节跳动面试官竟然问了我JDBC?

轻松等回家通知

面试官:你连SSO都不懂,就别来面试了

大厂竟然要考我SSO,卧槽。

阿里面试官让我用Zk(Zookeeper)实现分布式锁

他可能没想到,我当场手写出来了

终于,月薪过5万了!

来看几个问题想不想月薪超过5万?想不想进入公司架构组?想不想成为项目组的负责人?想不想成为spring的高手,超越99%的对手?那么本文内容是你必须要掌握的。本文主要详解bean的生命...

自从喜欢上了B站这12个UP主,我越来越觉得自己是个废柴了!

不怕告诉你,我自从喜欢上了这12个UP主,哔哩哔哩成为了我手机上最耗电的软件,几乎每天都会看,可是吧,看的越多,我就越觉得自己是个废柴,唉,老天不公啊,不信你看看…… 间接性踌躇满志,持续性混吃等死,都是因为你们……但是,自己的学习力在慢慢变强,这是不容忽视的,推荐给你们! 都说B站是个宝,可是有人不会挖啊,没事,今天咱挖好的送你一箩筐,首先啊,我在B站上最喜欢看这个家伙的视频了,为啥 ,咱撇...

代码注释如此沙雕,会玩还是你们程序员!

某站后端代码被“开源”,同时刷遍全网的,还有代码里的那些神注释。 我们这才知道,原来程序员个个都是段子手;这么多年来,我们也走过了他们的无数套路… 首先,产品经理,是永远永远吐槽不完的!网友的评论也非常扎心,说看这些代码就像在阅读程序员的日记,每一页都写满了对产品经理的恨。 然后,也要发出直击灵魂的质问:你是尊贵的付费大会员吗? 这不禁让人想起之前某音乐app的穷逼Vip,果然,穷逼在哪里都是...

2020春招面试了10多家大厂,我把问烂了的数据库事务知识点总结了一下

2020年截止目前,我面试了阿里巴巴、腾讯、美团、拼多多、京东、快手等互联网大厂。我发现数据库事务在面试中出现的次数非常多。

立即提问
相关内容推荐