JokeL 2020-04-11 22:13 采纳率: 0%
浏览 489

Python pandas库操作excel统计问题

python新手一枚,请问各路大神pandas库可以进行字符串数据频度统计的问题吗?
想利用pandas库来进行excel文件某列的数据统计,比如输出指定列数据频度次数前五的行这样。
groupby(),sort_values()这类函数查看文档之后好像都只能对int这类数值进行排序,
或者python中有什么更好的方法进行字符串频度排序吗?
万分感谢!!

  • 写回答

2条回答 默认 最新

  • 正在学C++ 2020-04-13 00:52
    关注

    我举个例子:对字符串列表进行数据频度统计

    import numpy as np
    li = ['cc','aa','cc','bb','aa','cc','cc','aa','cc','##','##','##']
    uni = np.unique(li)  # 唯一值
    dic = dict((a, li.count(a)) for a in uni) 
    print(dic.items())
    
    结果:
    dict_items([('##', 3), ('aa', 3), ('bb', 1), ('cc', 5)])
    
    dic = sorted(dic.items(),key= lambda x:x[1], reverse=True)  # True--降序
    print(dic)
    print(list(x[0] for x in dic[:2]))
    
    结果:
    [('cc', 5), ('##', 3), ('aa', 3), ('bb', 1)]
    ['cc', '##']
    
    评论

报告相同问题?

悬赏问题

  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥200 uniapp长期运行卡死问题解决
  • ¥15 latex怎么处理论文引理引用参考文献
  • ¥15 请教:如何用postman调用本地虚拟机区块链接上的合约?
  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?
  • ¥15 乘性高斯噪声在深度学习网络中的应用