嵌套列表，列表和字符串如何按行进行词频统计？

在做英文文本的自然语言处理，进行词频统计时遇到了问题
前面部分形成了几种格式的数据，但如果想进行数据按行词频统计都会出现问题：
1.有嵌套列表数据，如何按内部列表进行词频统计？
如有：[[a,b,c,a][a,b,c,b][a,b,c,c]]
希望得到类似: ('a':2,'b':1,'c':1)('a':1,'b':2,'c':1)('a':1,'b':1,'c':2)这样的结果

2.有list数据，每行的元素间由‘\n’分隔（其实是把嵌套列表乱拆了一下，如果有好方法也请告诉我！），如何把这个列表分行，并按行进行词频统计？

3.有分行str数据，如何按单词（因为出现过按单词里的字母统计词频的错误）按行进行词频统计？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

陈.py 2022-03-22 08:58

关注


words = [['a', 'b', 'c', 'a'],['a', 'b', 'c', 'b'],['a', 'b', 'c', 'c']]


def statistics(words):
    res = []
    for i in words:
        dict = {}
        for word in i:
            if word in dict.keys():
                dict[word] = dict[word] + 1
            else:
                dict[word] = 1
        w_order = sorted(dict.items(), key=lambda x: x[1], reverse=True)
        res.append(w_order)
    return res


print(statistics(words))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

嵌套列表，列表和字符串如何按行进行词频统计？ nlp python 自然语言处理
2022-03-22 01:57

回答 1 已采纳 words = [['a', 'b', 'c', 'a'],['a', 'b', 'c', 'b'],['a', 'b', 'c', 'c']] def statistics(words):
Python嵌套列表，怎么转字符串？ list python
2022-09-18 21:03

回答 2 已采纳如果我的回答对您有帮助，请选择“采纳此答案” lie = [('abc', 'v', '12345'), ('abc', 'v', '67'), ('abc', 'c', '12345'), ('ab
多行字符串转嵌套列表，怎么索引嵌套列表？ list python
2022-11-20 17:06

回答 3 已采纳不知道是不是这个意思： string = """ 同学第1排：a,b,c,d,e,f 同学第2排：1,2,3,4,5,6 同学第3排：你,我,他,她,它,她们 """ list2 = [] for r
初识人工智能---------自然语言处理&&词袋模型
2024-04-03 21:34

阑梦清川的博客标准化处理 for info in reader: print(info) reader对象存储的是CSV文件里所有行数据，相当于每一行数据都作为字符串列表返回。也就是说reader的每个元素都是字符串列表：为了便于管理，我们把它进行标准化的处理...
Python如何把含有字符串的多个列表合并成嵌套列表 python 有问必答
2021-12-13 01:33

回答 1 已采纳 list1 = [ 'a' , 'b' , 'c' ] list2 = [ '1' , '2' , '3' ] list3 = [ '你' , '好' , '吗' ] combinelist = [l
字符串如何转换为列表？ python 有问必答
2021-08-11 15:03

回答 6 已采纳代码如下，这里要用到python内置的eval()函数 l=['(1,2,3)','(4,5,6)'] s=[] for i in l: s.append(eval(i)) print(s)
为什么字符串也可以进行求余运算？如何计算？ python
2022-01-08 10:42

回答 1 已采纳 A
人工智能之知识图谱体系总结
2020-04-14 18:23

常耀斌的博客 人工智能的发展介绍：5次重要的发展里程碑认知智能的基础：海量行为数据的知识化（推理预测），既定知识的海量数据化（表示和存储）知识工程的发展：一阶谓语表示；知识的表示：语义网介绍：语义网要解决对Web...
delphi 字符串查找或者匹配的问题？
2018-08-05 14:07

回答 1 已采纳 ``` Arr : array[0..4] of WideString =( WideString('中国'), WideString('乌拉圭'), WideString('日本'),
matlab如何提取string数组每个字符串的前几位字符？ matlab
2021-09-26 21:35

回答 1 已采纳你好，可以这样处理： A = char(newstr2); year_month_day = [string(A(:,1:4)), string(A(:,5:6)), string(A(:,7:8))
输入中文字符串 按词语进行逆序输出 python 有问必答
2021-06-09 09:56

回答 3 已采纳 import jieba n = input() lst = jieba.lcut(n) #分词 print(lst) print(''.join([i for i in lst[::-1]]))
微课|中学生可以这样学Python（例11.3）：tkinter通信录管理系统1
2019-01-09 08:18

dongfuguo的博客计算决赛现场选手得分微课|中学生可以这样学Python（例5.5）：词频统计 微课|中学生可以这样学Python（例5.6、例5.7）：集合应用微课|中学生可以这样学Python（5.5.3节）：字符串格式化1 微课|中学生可以这样学...
怎么统计字符串中数字和字母数量并忽略“#”后面的字符？ python
2022-03-19 23:21

回答 1 已采纳【有帮助请采纳】 s = input()#输入字符串 s = s.split('#')[0]#将字符串按‘#’分割并将分割后的字符串形成列表，并取其第一个值（相当于#后面的都不要了） m,n =
微课|中学生可以这样学Python（8.4节）：递归算法例题讲解1
2018-12-31 11:08

dongfuguo的博客计算决赛现场选手得分微课|中学生可以这样学Python（例5.5）：词频统计 微课|中学生可以这样学Python（例5.6、例5.7）：集合应用微课|中学生可以这样学Python（5.5.3节）：字符串格式化1 微课|中学生可以这样学...
微课|中学生可以这样学Python（例11.4）：tkinter版图片查看器
2019-01-10 08:11

dongfuguo的博客计算决赛现场选手得分微课|中学生可以这样学Python（例5.5）：词频统计 微课|中学生可以这样学Python（例5.6、例5.7）：集合应用微课|中学生可以这样学Python（5.5.3节）：字符串格式化1 微课|中学生可以这样学...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月22日

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

嵌套列表，列表和字符串如何按行进行词频统计？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新