JokeL 2020-04-11 22:13 采纳率: 0%
浏览 488

Python pandas库操作excel统计问题

python新手一枚,请问各路大神pandas库可以进行字符串数据频度统计的问题吗?
想利用pandas库来进行excel文件某列的数据统计,比如输出指定列数据频度次数前五的行这样。
groupby(),sort_values()这类函数查看文档之后好像都只能对int这类数值进行排序,
或者python中有什么更好的方法进行字符串频度排序吗?
万分感谢!!

  • 写回答

2条回答

  • 正在学C++ 2020-04-13 00:52
    关注

    我举个例子:对字符串列表进行数据频度统计

    import numpy as np
    li = ['cc','aa','cc','bb','aa','cc','cc','aa','cc','##','##','##']
    uni = np.unique(li)  # 唯一值
    dic = dict((a, li.count(a)) for a in uni) 
    print(dic.items())
    
    结果:
    dict_items([('##', 3), ('aa', 3), ('bb', 1), ('cc', 5)])
    
    dic = sorted(dic.items(),key= lambda x:x[1], reverse=True)  # True--降序
    print(dic)
    print(list(x[0] for x in dic[:2]))
    
    结果:
    [('cc', 5), ('##', 3), ('aa', 3), ('bb', 1)]
    ['cc', '##']
    
    评论

报告相同问题?

悬赏问题

  • ¥30 帮我写一段可以读取LD2450数据并计算距离的Arduino代码
  • ¥15 C#调用python代码(python带有库)
  • ¥15 矩阵加法的规则是两个矩阵中对应位置的数的绝对值进行加和
  • ¥15 活动选择题。最多可以参加几个项目?
  • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
  • ¥15 vs2019中数据导出问题
  • ¥20 云服务Linux系统TCP-MSS值修改?
  • ¥20 关于#单片机#的问题:项目:使用模拟iic与ov2640通讯环境:F407问题:读取的ID号总是0xff,自己调了调发现在读从机数据时,SDA线上并未有信号变化(语言-c语言)
  • ¥20 怎么在stm32门禁成品上增加查询记录功能
  • ¥15 Source insight编写代码后使用CCS5.2版本import之后,代码跳到注释行里面