m0_70180100 2022-05-04 21:53 采纳率: 83.3%
浏览 26
已结题

Python用于检测英文文本词频的一些问题。

问题遇到的现象和发生背景

我想用Python设计一个软件。输入两个文本(文本一:英文课文原文,文本二:基于课文原文出的重点单词表),为统计重点单词在原文中出现的次数,并且根据次数大小将重点单词排序,便于学生侧重复习。

问题相关代码,请勿粘贴截图

def keben():
txt=open("C:\Users\cpy\Desktop\ceshikeben.txt","r").read()
txt=txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~':
txt=txt.replace(ch,"")
return txt
#用于去除英文课文文本中的特殊字符,并用空格隔开其中的单词。

def zhongdian():
txt=open("C:\Users\cpy\Desktop\ceshizhongdian.txt","r").read()
txt=txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~':
txt=txt.replace(ch,"")
return txt
#此函数用来去除 重点单词文本中单词间的特殊符号,使其用空格隔开。
a=keben()
b=zhongdian()
zhongdian=b.split()
dic={}
c=list()
d=len(zhongdian)
for item in zhongdian:
dic["item"]=a.count(item)
然后得到一个字典,其中的键是重点单词,值是其在文本中出现的次数。
然后就不知道应该怎么排序了,怎么打印了。

运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果

正常运行并且能完成要求的代码。
可以复制我的代码,但请您一定要给出能运行的代码。

  • 写回答

2条回答 默认 最新

  • 笨鸟快飞呀 2022-05-04 22:26
    关注

    没有考虑你输出的格式,代码如下:

    wordmap = dict()
    
    wordmap['a'] = 4
    wordmap['b'] = 3
    wordmap['c'] = 6
    wordmap['f'] = 8
    
    # 排序前
    print('排序前')
    print(wordmap)
    
    # 排序后
    wordmap2 = sorted(wordmap.items(),key=lambda x:x[1], reverse=True)
    print('排序后')
    print(wordmap2)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月12日
  • 已采纳回答 5月4日
  • 创建了问题 5月4日

悬赏问题

  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料