词频统计之《哈姆雷特》Python

Hamlet《哈姆雷特》是莎士比亚的一部经
典悲剧作品。这里提供了该故事的文本文
件：hamlet.txt。
请统计该文件中出现英文的词频，按照如下
格式打印输出前10个高频词语：
the ,1138
即：英文单词
（左对齐，宽度为10）+逗号+词语出现的频率（右对齐，宽度为5)
要求与说明：
1.标点符号及组合不算作英文词语，去除的
标点及特殊符号如下！"#$%&()*+,-./:;<=>?
2.同一单词的各种大小写形式记作一个词.
如The和the相同
3.在程序中，请使用文件名打开文件：
hamlet.txt


f = open("hamlet.txt","r")
f.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
越重天新星创作者: Java技术领域 2024-12-13 12:22
关注
本答案参考多次询问ChatGPT-3.5后选择的最佳回答，若是满意，还请采纳，谢谢。

import string def process_file(): word_count = {} with open('hamlet.txt', 'r') as f: for line in f: line = line.translate(str.maketrans('', '', string.punctuation)) line = line.lower() words = line.split() for word in words: if word not in word_count: word_count[word] = 1 else: word_count[word] += 1 items = list(word_count.items()) items.sort(key=lambda x: x[1], reverse=True) for i in range(10): word, count = items[i] print(f"{word:<10},{count:>5}") if __name__ == '__main__': process_file()

在上述代码中：

首先定义了process_file函数，在函数内部，首先创建了一个空的字典word_count用于存储单词和其出现的频率。
然后打开hamlet.txt文件，对于文件中的每一行，先去除标点符号（通过translate方法结合string.punctuation），再转换为小写字母，然后将每行分割成单词列表。
对于每个单词，如果不在word_count字典中，则将其加入字典且计数为1，否则将其计数加1。
之后将字典转换为包含元组（单词，计数）的列表items，并按照计数从大到小排序。
最后取前10个元素，按照要求的格式打印输出。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python123词频统计之哈姆雷特_【Python】文本词频统计
2020-12-06 02:58

weixin_39552179的博客 哈姆雷特英文三国演义中文哈姆雷特英文词频分析def getText():txt=open("hamlet.txt","r").read()#打开文本,输入具体的文本路径txt=txt.lower()#将文本中所有的英文字符变成小写for ch in '!"#$%&()*+,-./;:<...
Python英文词频统计（哈姆雷特）程序示例
2022-12-13 15:29

永远是少年啊的博客今天继续给大家介绍Python相关知识，本文主要内容是Python英文词频统计程序示例，主要是对英文文本——《哈姆雷特》进行分词。一、英文文本词频统计思路二、英文文本词频统计程序编写三、程序执行结果展示
python词频统计之《哈姆雷特》_哈姆雷特词频统计,Hamlet
2021-03-06 23:27

lover bacon的博客 def getText(): txt=open(“hamlet.txt”,“r”).read() txt=txt....源代码出自MOOC Python程序语言设计6.6 添加链接描述关于sort()的详细解释在https://blog.csdn.net/weixin_38198369/article/details/105021708
Python之词频统计
2023-04-20 19:23

在Python编程语言中，词频统计是一项常见的任务，特别是在自然语言处理（NLP）领域。这个任务涉及到对文本数据进行分析，找出其中各个词汇出现的频率。在这个场景中，我们有两个具体的实例：对《三国演义》人物出场...
python学习文本词频统计hamlet三国演义
2021-04-10 21:04

在Python编程领域，词频统计是一项基础且重要的任务，它涉及到自然语言处理（NLP）和数据挖掘。在这个项目中，我们关注的是如何使用Python来分析文本中的词频，特别是针对"hamlet.txt"和"三国演义.txt"这两部文学...
python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计
2020-11-20 22:09

weixin_39678451的博客在本文中利用Python对Hamlet英文词频进行统计，我们解决该问题的基本流程应该如下：1、读取文件2、将所有英文字母变成小写3、根据标点符号，对!'#$%&()*+,-./:;?@[\\]^_‘{|}~等对单词进行分割，形成列表4、对每个...
python哈姆雷特词频统计_【Python】词频统计
2020-11-25 06:37

weixin_39610722的博客英文文本词频统计统计英文词频分为两步：文本去噪及归一化使用字典表达词频代码：#CalHamletV1.pydef getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;?@[\\]^_‘{|}~'...
python哈姆雷特词频统计代码_Hamlet（英文）词频统计
2020-12-06 02:58

weixin_39600885的博客 #示例：counts={"hello":4,"how":7,"but":2,"nice":4} #接下来对字典中词频次数进行排序 items=list(counts.items()) #将counts.items() 变成列表，便于操作 items.sort(key=lambda x:x[1],reverse=True) #sort()...
python哈姆雷特词频统计_Python实例10：文本词频统计
2020-11-20 22:09

weixin_39555320的博客 Python实例10：文本词频统计6.6.1 问题分析在英文中文中，出现哪些词，出现多少次？6.6.2 hamlet英文词频统计CalHamletV1.py6.6.3 三国演义人物出场统计CalThreeKingdomsV1.pyCalThreeKingdomsV2.py# CalHamletV1.py...
8-2 词频统计之《哈姆雷特》
2023-07-18 01:27

在这个“8-2 词频统计之《哈姆雷特》”的项目中，我们聚焦于利用编程技术对《哈姆雷特》的文本进行词频统计，以揭示其语言特征和主题线索。词频统计是一种常见的自然语言处理（NLP）任务，对于理解大量文本数据的...
Python实现统计英文文章词频的方法分析
2020-09-19 16:06

Python作为一种强大的编程语言，提供了多种库和方法来高效地完成这一任务。本文将详细介绍如何使用Python来统计英文文章中的词频，并通过实际案例进行演示。 #### 二、理论基础在进行词频统计之前，我们需要了解...
python哈姆雷特词频统计_Python练习题15：文本词频统计：英文版哈姆雷特
2021-03-06 00:25

CHV5的博客文本词频统计：：一篇文章，出现了哪些词？哪些词出现的最多？‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪...
python哈姆雷特英文词频统计_MOOC《Python语言程序设计》第6周练习题
2020-12-06 02:59

weixin_39536806的博客讲解2个颇有用处的实例：基本统计值计算和文本词频统计，其中，即有英文Hamlet的词频统计，也有中文《三国演义》的人物出场统计；进一步讲解用于中文分词的jieba库，从此以后，处理中英文文本、做些统计分析将不再是...
使用python的jieba库实现词频统计.zip
2021-08-06 20:51

在Python编程语言中，jieba库是一个非常流行的中文分词工具，它提供了丰富的功能，包括分词、词性标注、关键词提取等。本项目利用jieba库实现了对两部文学作品——莎士比亚的《哈姆雷特》和罗贯中的《三国演义》——...
Python实现英文词频统计：以hamlet为例
2021-07-13 15:18

allway2的博客 #CalWordNum.py def GetTxt(): txt=open("hamlet.txt",'r').read() txt=txt.lower() for ch in "!'#$%&()*+,-./:'<=>?@[\\]^-‘{|}~": #将特殊符号替换为空格 txt=txt...https://python123.io/resources/pye/hamlet.txt
Python实例10：文本词频统计
2020-08-06 09:37

辣克糖LuckSugar的博客 Python实例10：文本词频统计 6.6.1 问题分析在英文中文中，出现哪些词，出现多少次？ 6.6.2 hamlet英文词频统计 CalHamletV1.py 6.6.3 三国演义人物出场统计 CalThreeKingdomsV1.py CalThreeKingdomsV2.py # ...
python中文词频排序_python统计词频并排序
2021-03-17 18:37

自然语言处理老白的博客 Python 贝叶斯文本分类模型从原理到实现朴素贝叶斯分类器是一种有监督学习, 常见有两种模型, 多项式模型...6 周课后练习中“哈姆雷特词频统计”程序打包成单独文件。(上述内容仅供个人学习使用,禁止转载) 第 5 页/共...
python词频统计完整步骤_Python学习心得（一）：词频统计，自顶向下设计
2020-11-24 13:14

weixin_39627052的博客今天编的这个小程序是哈姆雷特中的词频统计，即统计哈姆雷特中各个词语出现的频率。我第一次尝试了使用自顶向下的设计方法和自下向上的执行方法。期间出现了很多错误，在此记录，以免日后再犯。编程前截取网上Hamlet...
python英文词频统计jieba库,python英文词频统计代码
2024-01-03 16:44

Rtee1的博客这篇文章主要介绍了python英文词频统计并按顺序输出，具有一定借鉴价值，需要的朋友可以...今天继续给大家介绍Python相关知识，本文主要内容是Python英文词频统计程序示例，主要是对英文文本——《哈姆雷特》进行分词。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月11日

词频统计之《哈姆雷特》Python

1条回答 默认 最新

问题事件

1条回答默认最新