题主刚学pandas不久,遇到这个问题希望各位大大帮忙解决。
希望在一份电影数据表中统计重复出现次数前几位的演员名称,原始dataframe数据格式如下:
这是想要进行字符串统计的cast序列内容
尝试使用了values_count()方法,没有效果
也尝试了Counter()方法,报错unhashed list
想知道如何正确运用分隔符把这些数据切成单个的字符串并存入列表的形式,再进行统计
还有想知道unhashed list报错的解决方法,网上只说了为什么但是好像查不到如何解决
谢谢各位大大
————————————————————————————————
补充一个新问题,同样与计数有关
如何计算各个州的婴儿出生性别F和M的总和,想要绘制成并列条形图的形式,但是用duplicated()方法好像统计不出来,需要用自定义函数生成,想了半天没想通,希望大大们顺便支个招。