python文本词汇出现次数统计

从云南大学校园网上下载一段关于云南大学的介绍文本，将文本保存在名称为“云南大学.txt”文本文件中，注意保存时文件编码要选“UTF-8”。编写程序完成对“云南大学.txt”文件中词汇的出现次数的统计，要求将长度为1的词去掉，并去掉'高校','大学'两个词，按各词出现次数从高到低排序后输出前20项。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

语言-逆行者 2023-06-05 23:26

关注

jieba实现，应该符合你的要求:

import jieba
from collections import Counter

# 打开文件
with open('云南大学.txt', 'r', encoding='utf-8') as f:
    # 读取文件内容为字符串
    text = f.read()

# 对文本进行分词并去除长度为1的词和'高校'、'大学'两个词
words = []
for word in jieba.cut(text):
    if len(word) > 1 and word not in ('高校', '大学'):
        words.append(word)

# 统计词频并排序
word_counts = Counter(words)
sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)

# 输出前20项
for word, count in sorted_word_counts[:20]:
    print(f'{word}: {count}')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(6条)

报告相同问题？

关注问题

python 统计人名及其出现次数 python
2023-04-21 14:13

回答 2 已采纳 import random org = [] for i in range(20): a =random.choice('abcdefghijklmnopqrstuvwxyz') or
python文本中出现的词汇关联性分析 python
2022-09-27 16:51

回答 1 已采纳可以参考： https://www.jianshu.com/p/c4f
python：字符串里全部字母出现次数的统计 python
2021-12-15 14:24

回答 1 已采纳问题1：先收集字符串里各个字母出现的次数，然后循环26个字母，如果字母不在字典里，则添加键(字母)值(0)问题2：分别输出还是用循环，可以循环键，也可以循环键值对，然后用print单行分别打印
Python统计文本词汇出现次数的实例代码
2020-09-17 20:10

在Python编程中，统计文本词汇出现次数是一个常见的任务，尤其在自然语言处理（NLP）和数据分析领域。下面我们将深入探讨如何使用Python来实现这一功能。首先，我们来看一个基础的实例。在Python中，我们可以利用...
关于Python对Excel内多个工作表所出现对象出现次数统计 python
2022-07-10 00:05

回答 1 已采纳可以用pands库完成，读取时指定工作表Sheet2，然后用.value_counts().to_dict()统计元素出现次数并转为字典类型输出 import pandas as pd df = p
python 统计字典每个键值规定值出现的次数 python
2022-04-19 14:38

回答 2 已采纳要这个？ for k,v in d.items(): print(k,v.count(396),v.count(13),v.count(5))
python中统计字符串中每个字母出现的次数 python
2021-12-07 19:56

回答 1 已采纳 def Character(Str): letters = 0 for s in Str: if 97<=ord(s)<=122 or 65<=ord
python实现统计文本中单词出现的频率详解
2020-09-19 09:18

在Python编程中，统计文本中单词出现的频率是一项常见的任务，特别是在自然语言处理（NLP）和文本分析领域。这个任务可以帮助我们理解文本的主要主题、关键词以及词汇的分布情况。下面将详细解释如何使用Python实现...
请问python如何统计循环次数 python
2021-08-10 18:13

回答 2 已采纳很好奇你的代码是怎么跑起来的，你试一试我的我设置了跑10000000000000.0次后自动停止，有用的话点一下采纳
Python编程语言 list python 有问必答
2021-12-29 11:00

回答 2 已采纳 import random n=int(input()) list=[] for i in range(n): list.append(random.randint(1,200)) print
python如何实现两列中行数据相同的次数统计 python
2021-03-17 18:02

回答 1 已采纳 import pandas as pd data = pd.read_excel('c:/users/用户/desktop/数据.xlsx') temp = [[name[0],name[1],
Python统计单词出现的次数
2020-12-24 12:38

这道题在实际应用场景中使用比较广泛，比如统计历年来四六级考试中出现的高频词汇，记得李笑来就利用他的编程技能出版过一本背单词的畅销书，就是根据词频来记单词，深受学生喜欢。这就是一个把编程技能用来解决实际...
python统计白居易的《长恨歌》中“长”“君王”出现的次数。 python 有问必答
2022-05-13 23:55

回答 5 已采纳用字符串.count("长")字符串.count("君王")就是统计出现次数 text = """ 汉皇重色思倾国，御宇多年求不得。杨家有女初长成，养在深闺人未识。天生丽质难自弃，一朝选在君王
Python统计文本词汇出现次数
2020-02-27 00:00

算法与编程之美的博客欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。问题描述有时在遇到一个文本需要统计文本内词汇的次数的时候...
python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...
2020-11-20 21:42

weixin_39731845的博客问题描述有时在遇到一个文本需要统计文本内词汇的次数的时候，可以用一个简单的python程序来实现。解决方案首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔)，因为需要的是一个程序，所以要考虑如何将...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请采纳用户回复 6月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请回答用户的提问 6月5日
展开全部

悬赏问题

¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd

python文本词汇出现次数统计

7条回答 默认 最新

问题事件

悬赏问题

7条回答默认最新