诶咦啊哦喂 2021-05-31 11:30 采纳率: 69.2%
浏览 7
已采纳

然后怎么输出出现次数前十的单词??[face]emoji:010.png[/face][face]e

然后怎么输出出现次数前十的单词??[face]emoji:010.png[/face][face]emoji:011.png[/face]
  • 写回答

1条回答 默认 最新

  • 小P聊技术 2021-06-02 21:57
    关注

    1 统计单词出现次数:

    def count_word():
        count = {}
        keys = []
        with open('test.txt') as f:
            lines = f.readlines()
        for line in lines:
            first_word = line.split(' ')[0]
            if first_word not in keys:
                keys.append(first_word)
        count = count.fromkeys(keys,0) #fromkeys方法不会直接修改原字典,它会返回一个新字典,所以如果要使用心字典必须先赋值
        print(count)
        for line in lines:
            first_word = line.split(' ')[0]
            count[first_word] +=1
        print(count)

     2 前10出现的单词:

    import re
    from collections import Counter
     
    with open('1.txt', 'r', ) as f:
        words = f.read()                         # 将文件的内容全部读取成一个字符串
        count = Counter(re.split(r"\W+", words))  # 以单词为分隔
     
    result = count.most_common(10)                # 统计最常使用的前10个
    print(result)
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 AttributeError: 'NoneType' object has no attribute 'drop_duplicates'报错
  • ¥15 编写c++计算器,用类和栈来做,要求如下
  • ¥15 以下代码,运行结果报错
  • ¥15 Vivado仿真数据出错
  • ¥15 银河麒麟不支持vant等前端框架怎么办?
  • ¥15 vue3的子组件在父页面调用不显示不生效问题
  • ¥15 cadence PEX
  • ¥15 phython创建了文件 显示在项目下面,但运行不了,运行时还是运行main文件,并且说main文件不允许并行运行
  • ¥20 C++哈希表的设计构造哈希表
  • ¥15 FutureWarning:不推荐使用空或全 NA 条目的 DataFrame 串联行为。怎么改呢?