走走吧哈哈哈 2021-11-04 22:37 采纳率: 100%
浏览 85
已结题

关于#python#的问题:安装第三方扩展库jieba,用该库所提供的一些方法,分词后统计每个词的出现次数,每行显示5个字词的统计结果

安装第三方扩展库jieba,用该库所提供的一些方法,对下面的新闻进行分词,分词后统计每个词的出现次数,最终输出统计结果,每行显示5个字词的统计结果。提示:(1)不要统计各种标点,
如:punctuation=r'[’!"#$%&'()*+,-./:;?@[\]^_`{|}~]+,、。\n “”();—'
(2)不要统计数值,如228等。

  • 写回答

1条回答 默认 最新

  • CSDN专家-HGJ 2021-11-04 22:58
    关注

    试试这样写:

    import jieba
    
    punctuation = r'[’!"#$%&\'()*+, -./: ; ?@ [\]^_`{|}~] +,、。\n “”();—'
    with open('t11031.txt','r',encoding='utf-8') as f:
        words=jieba.cut(f.read())
        words=[w for w in words if w not in punctuation and w.isalpha()]
        dic={}
        for k in words:
            if k in dic:
                dic[k]+=1
            else:
                dic[k]=1
        for n,(k,v) in enumerate(dic.items()):
            if n%6!=0:
                print(f'{k}:{v}',end='\t')
            else:
                print()
    

    运行结果:

    库是:1  一款:1  优秀:1  的:5    Python:1
    中文:1  分:2    词库:1  支持:1  三种:2
    精确:4  模式:8  全:2    和:1    搜索引擎:2
    是:2    特点:1  试图:1  将:2    语句:2
    切分:3  不:1    存在:2  冗余:2  数据:2
    做:1    文本:1  分析:1  中:1    所有:1
    词:2    词语:1  都:1    出来:1  速度:1
    但是:1  在:1    基础:1  上:1    对长:1
    
    
    

    如有帮助请点采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 11月5日
  • 已采纳回答 11月5日
  • 创建了问题 11月4日

悬赏问题

  • ¥15 python点云生成mesh精度不够怎么办
  • ¥15 QT C++ 鼠标键盘通信
  • ¥15 改进Yolov8时添加的注意力模块在task.py里检测不到
  • ¥50 高维数据处理方法求指导
  • ¥100 数字取证课程 关于FAT文件系统的操作
  • ¥15 如何使用js实现打印时每页设置统一的标题
  • ¥15 安装TIA PortalV15.1报错
  • ¥15 能把水桶搬到饮水机的机械设计
  • ¥15 Android Studio中如何把H5逻辑放在Assets 文件夹中以实现将h5代码打包为apk
  • ¥15 使用小程序wx.createWebAudioContext()开发节拍器