Drink VC 2021-04-21 14:53 采纳率: 0%
浏览 38

Python练习题:词频统计

def getText():
    #获取文件
    text = open("Walden.txt","r").read()
    text = text.lower()
    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~' :
        text = text.replace(ch," ")
    return  text

txt = getText()
words = txt.split()
counts = {}               #定义空字典
for word in words:
    counts[word] = counts.get(word,0) + 1

items = list(counts.items())
#将列表按照count中键值从大到小的顺序进行排列
items.sort(key=lambda x:x[1],reverse=True)

#输出结果,前二十位最高频词汇
for i in range(10):
    word,count = items[i]
    print("#{0:<10}{1:>5}".format(word,counts))

词频统计代码如上,但是出现报错,请问这是什么原因啊?

  • 写回答

4条回答 默认 最新

  • CSDN专家-HGJ 2021-04-21 14:58
    关注

    打开文件语句中加入编码格式参数,改为text = open("Walden.txt","r",encoding='utf-8‘).read(),试一下看看。另代码末尾打印语句中也有个小错误,是count而不是counts

    评论

报告相同问题?

悬赏问题

  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?