Python词频统计

怎么在一段英语报告中提取词频统计，并按顺序排列，尝试了几种代码都是报错，求告知

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

三只小菜猿 PHP领域新星创作者 2022-09-02 11:41

关注

import re

# 请根据处理要求下面区域完成代码的编写。
def get_artical(artical_path):
    with open(artical_path) as fr:
        data = fr.read()
    return data

#处理函数
def handle(data):    
    counts = {}
    #data = data.lower()
    data1 = re.sub('\n',' ',data)#替换换行符为空格
    reg = "[^A-Za-z\']"
    data = re.sub(reg,' ',data1)#只保存英文,同时保留don't isn't类似单词
    data = data.lower()
    list_data = data.split()#列表
    #遍历统计
    for word in list_data:
        if word in counts.keys():
            counts[word] = counts[word] +1
        else:
            counts[word] = 1
    return counts

# get_artical()为自定义函数，可用于读取指定位置的试题内容。
data = get_artical('./artical.txt')
re_counts = handle(data)
re_counts = sorted(re_counts.items(),key=lambda x:x[1],reverse=True)#词频从大到小排序，
print(re_counts)

试试这个看行不行

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(4条)

报告相同问题？

关注问题

Python词频统计 python
2022-09-02 11:37

回答 5 已采纳 import re # 请根据处理要求下面区域完成代码的编写。 def get_artical(artical_path): with open(artical_path) as fr:
python词频统计探讨题 python
2022-05-29 10:46

回答 2 已采纳因为你现在是把‘aeiou’当成一个完整的字符串去检查，当然什么也找不到，所以字典是空的，最后当然会报错了。只要改后面的部分就可以了： counts={} for word in words:
python实现词频统计问题 python
2022-10-21 22:01

回答 4 已采纳 import re data = 'In our world , one creature without any rivals is a lifeless creature. If a man l
python统计单词词频 python 有问必答
2021-05-16 10:44

回答 4 已采纳 def getText(): txt = open("C:/Users/Lenovo/Desktop/hamlet.txt", "r").read() txt = txt.lowe
python小问题，词频统计，统计次数。 python 开发语言
2021-11-10 17:13

回答 3 已采纳 from collections import Counter with open(r'python23成绩10-25-2021.csv', encoding='utf-8') as f:
python如何统计csv/Excel文件里面的某一列数据的词频？ python
2021-12-17 21:35

回答 3 已采纳 https://pandas.pydata.org/docs/reference/api/pandas.Series.str.count.html?highlight=count#pandas.Ser
python文件词频统计
2020-01-17 15:58

读取给定文本文件，统计单词，计算TOP 10 有一个文件sample.txt，对其进行单词统计，不区分大小写，并显示单词重复最多的10个单词。
python用jieba库进行哈姆雷特词频统计 python
2022-06-23 10:48

回答 2 已采纳找不到文件，你现在应该使用的是相对路径的写法，保证txt文件和运行的脚本文件在同一目录下。文件名也用复制的方式，避免出错。有帮助请采纳，还有不懂的可以继续追问~
英文词频统计相关问题 python
2021-11-22 12:30

回答 1 已采纳 sentence = "你的文本" result = {word: sentence.split('乐').count(word) for word in set(sentence.split('乐
词频统计的时候出错显示No such file or directory python 有问必答
2021-11-25 14:02

回答 2 已采纳把这个txt跟你的py文件放一起
python词频统计2
2023-06-07 15:33

python词频统计2
python，turtle模块 python
2022-05-22 19:25

回答 1 已采纳如下所示，主要在遍历字典时要凑好坐标位置有点麻烦： import turtle t = turtle.Pen() t.color("red") t.pensize(3) t.speed(0) w
Python之词频统计
2023-04-20 19:23

《三国演义》人物出场统计、HAMLET词频统计
基于python的词频统计源码
2023-08-17 22:44

该文件是一个基于python的词频统计源码，支持各种文件格式，实现对单文件词频统计及排序，也可以对文件夹下的多文件同时进行统计。关于文件编码在文件中有相关提示，也可以网上自查。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月2日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

Python词频统计

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新