诶咦啊哦喂 2021-05-31 11:30 采纳率: 75%
浏览 7
已采纳

然后怎么输出出现次数前十的单词??[face]emoji:010.png[/face][face]e

然后怎么输出出现次数前十的单词??[face]emoji:010.png[/face][face]emoji:011.png[/face]
  • 写回答

1条回答 默认 最新

  • 小P聊技术 2021-06-02 21:57
    关注

    1 统计单词出现次数:

    def count_word():
        count = {}
        keys = []
        with open('test.txt') as f:
            lines = f.readlines()
        for line in lines:
            first_word = line.split(' ')[0]
            if first_word not in keys:
                keys.append(first_word)
        count = count.fromkeys(keys,0) #fromkeys方法不会直接修改原字典,它会返回一个新字典,所以如果要使用心字典必须先赋值
        print(count)
        for line in lines:
            first_word = line.split(' ')[0]
            count[first_word] +=1
        print(count)

     2 前10出现的单词:

    import re
    from collections import Counter
     
    with open('1.txt', 'r', ) as f:
        words = f.read()                         # 将文件的内容全部读取成一个字符串
        count = Counter(re.split(r"\W+", words))  # 以单词为分隔
     
    result = count.most_common(10)                # 统计最常使用的前10个
    print(result)
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能