m0_58320362 2021-05-16 23:39 采纳率: 100%
浏览 45
已采纳

救救孩子吧,太难了。。。

用汉语输入两句话,统计其中出现各种词语的次数。 (给出源程序代码并截图运行结果)

  • 写回答

2条回答 默认 最新

  • 小P聊技术 2021-05-17 09:14
    关注

    问题描述

    有时在遇到一个文本需要统计文本内词汇的次数的时候,可以用一个简单的python程序来实现。

    解决方案

    首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程序,所以要考虑如何将文件打开而不是采用复制粘贴的方式。这时就要用到open()的方式来打开文档,然后通过read()读取其中内容,再将词汇作为key,出现次数作为values存入字典。

    图 1 txt文件内容

    再通过open和read函数来读取文件:

    open_file=open("text.txt")

    file_txt=open_file.read()

    然后再创建一个空字典,将所有出现的每个词汇作为key保存到字典中,对文本从开始到结束,循环处理每个词汇,并将词汇设置为一个字典的key,将其value设置为1,如果已经存在该词汇的key,说明该词汇已经使用过,就将value累积加1。

    代码示例:

    def wordcount(readtxt):

        readlist = readtxt.split()

        dict1={}

        for every_world in readlist:

            if every_world in dict1:

                dict1[every_world] += 1

            else:

                dict1[every_world] = 1

        return dict1

    print(wordcount(file_txt))

    这里加了def函数把该程序封装成一个函数。

    最后输出得到词汇出现的字典:

    图 2 形成字典

    END

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 请问有人会紧聚焦相关的matlab知识嘛?
  • ¥50 yalmip+Gurobi
  • ¥20 win10修改放大文本以及缩放与布局后蓝屏无法正常进入桌面
  • ¥15 itunes恢复数据最后一步发生错误
  • ¥15 关于#windows#的问题:2024年5月15日的win11更新后资源管理器没有地址栏了顶部的地址栏和文件搜索都消失了
  • ¥100 H5网页如何调用微信扫一扫功能?
  • ¥15 讲解电路图,付费求解
  • ¥15 有偿请教计算电磁学的问题涉及到空间中时域UTD和FDTD算法结合的
  • ¥15 three.js添加后处理以后模型锯齿化严重
  • ¥15 vite打包后,页面出现h.createElement is not a function,但本地运行正常