关于#python#的问题：安装第三方扩展库jieba，用该库所提供的一些方法，分词后统计每个词的出现次数，每行显示5个字词的统计结果

安装第三方扩展库jieba，用该库所提供的一些方法，对下面的新闻进行分词，分词后统计每个词的出现次数，最终输出统计结果，每行显示5个字词的统计结果。提示：（1）不要统计各种标点，
如：punctuation=r'[’!"#$%&'()*+,-./:;?@[\]^_`{|}~]+，、。\n　“”（）；—'
（2）不要统计数值，如228等。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN专家-HGJ 2021-11-04 22:58

关注

试试这样写：

import jieba

punctuation = r'[’!"#$%&\'()*+, -./: ; ?@ [\]^_`{|}~] +，、。\n　“”（）；—'
with open('t11031.txt','r',encoding='utf-8') as f:
    words=jieba.cut(f.read())
    words=[w for w in words if w not in punctuation and w.isalpha()]
    dic={}
    for k in words:
        if k in dic:
            dic[k]+=1
        else:
            dic[k]=1
    for n,(k,v) in enumerate(dic.items()):
        if n%6!=0:
            print(f'{k}:{v}',end='\t')
        else:
            print()

运行结果：

库是:1  一款:1  优秀:1  的:5    Python:1
中文:1  分:2    词库:1  支持:1  三种:2
精确:4  模式:8  全:2    和:1    搜索引擎:2
是:2    特点:1  试图:1  将:2    语句:2
切分:3  不:1    存在:2  冗余:2  数据:2
做:1    文本:1  分析:1  中:1    所有:1
词:2    词语:1  都:1    出来:1  速度:1
但是:1  在:1    基础:1  上:1    对长:1

如有帮助请点采纳。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

关于#python#的问题：安装第三方扩展库jieba，用该库所提供的一些方法，分词后统计每个词的出现次数，每行显示5个字词的统计结果 python 有问必答
2021-11-04 22:37

回答 1 已采纳试试这样写： import jieba punctuation = r'[’!"#$%&\'()*+, -./: ; ?@ [\]^_`{|}~] +，、。\n　“”（）；—' with open(
关于#python#的问题：python jieba库安装失败了怎么办 python 有问必答
2022-10-12 23:20

回答 3 已采纳题主电脑中有多个版本的python，安装jieba的python根据路径显示的是python3.9，而运行脚本的python版本是3.8.8 Python 3.8.8(default, Apr 13
Python的jieba库输出全部分词哪里出了问题 python
2022-06-02 11:36

回答 1 已采纳代码没错，只是你输出的内容错了可以参考 jieba.cut与jieba.lcut的区别_blackieliu的博客-CSDN博客_jieba.cut
python第三方库：使用Jieba对抓取的数据进行中文分词
2022-04-11 09:09

go2coding的博客版权声明：本文为博主原创文章，转载请...但是由于InfoBox没有前后文和语义概念，所以效果不是很好，这篇文章主要是爬取百度5A景区摘要信息，再利用Jieba分词工具进行中文分词，最后提出文本聚类算法的一些概念知识。
python jieba库调用不成功 python
2022-08-11 20:23

回答 4 已采纳感谢各位，已经解决了，在隔壁帖子找到了解决方法https://blog.csdn.net/national_/article/details/121594916
python实现中文分词，jieba库实现中文分词自然语言处理
2022-11-24 22:45

回答 1 已采纳这是详细的教程https://blog.csdn.net/weixin_44095417/article/details/121146386
python中jieba库遇到的问题 python vscode 有问必答
2022-01-20 15:42

回答 2 已采纳看出来了，你不要用和库名一样的文件名把程序名改为 myjieba.py
一篇博客带你领略学习Python的第三方库---如何获取和安装第三方库，关于三种常见第三方库的下载和讲解（pyinstall库，jieba库，wordcloud库），更多第三方库的分类介绍
2024-03-16 18:56

Forcible Bug Maker的博客本篇博客讲了关于python第三方库的获取和安装，三种常见第三方库的安装和应用（pyinstall库，jieba库，wordcloud库），以及更多第三方库的分类介绍。写本篇博客的过程也让我渐渐体会到了python库的魅力以及库在...
Python安装第三方库出现错误 python
2022-08-18 18:05

回答 7 已采纳安装setuptools (适用于未安装setuptools的情况)pip install setuptools升级setuptools (适用于已安装setuptools的情况)pip instal
请问使用jieba分词如何避免把我的时间词分开？ nlp python 自然语言处理
2022-04-29 20:27

回答 1 已采纳能不能用正则表达式先将这些筛出来，然后将其在语料中的删除，新的语料使用jieba分词，最后将两组词拼接
python的jieba拓展库使用，并用matplotlib和wordcloud生成词云 python
2022-10-22 23:02

回答 1 已采纳首先可以在网上下一个停用词文本：hit_stopwords.txt，然后将你的文章写到一个文本文件“文章.txt”中，代码如下： from collections import Counter imp
Python入门：jieba库的使用
2018-05-17 21:20

留兰香丶的博客 jieba 库是一款优秀的 Python 第三方中文分词库，jieba 支持三种分词模式：精确模式、全模式和搜索引擎模式，下面是三种模式的特点。精确模式：试图将语句最精确的切分，不存在冗余数据，适合做文本分析全模式：...
python用jieba库进行哈姆雷特词频统计 python
2022-06-23 10:48

回答 2 已采纳找不到文件，你现在应该使用的是相对路径的写法，保证txt文件和运行的脚本文件在同一目录下。文件名也用复制的方式，避免出错。有帮助请采纳，还有不懂的可以继续追问~
想用好Python？标准库~第三方库~快搞明白各种库的使用方向
2022-04-25 00:15

Hulake_的博客本文介绍了Python 计算生态及各种库的应用，大致有turtle 库函数、random 库函数、time 库函数、PyInstaller 库、jieba 库、wordcloud 库与可视化词云、数据分析方向、文本处理方向、数据可视化方向、用户图形界面...
【Python Onramp】3. Python的文本分析（1）jieba分词：第三方库和基本面向对象编程
2021-06-28 15:50

Honour Van的博客本文目录系列文章目录项目描述语法总览语法点1：模块和第三方库语法点2：jieba库，基本分词和词性标注语法点3：基本的可视化：wordcloud库语法点4：列表生成式语法点5：函数与面向对象具体实现step1：jieba分词原型...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月4日

悬赏问题

¥15 python点云生成mesh精度不够怎么办
¥15 QT C++ 鼠标键盘通信
¥15 改进Yolov8时添加的注意力模块在task.py里检测不到
¥50 高维数据处理方法求指导
¥100 数字取证课程关于FAT文件系统的操作
¥15 如何使用js实现打印时每页设置统一的标题
¥15 安装TIA PortalV15.1报错
¥15 能把水桶搬到饮水机的机械设计
¥15 Android Studio中如何把H5逻辑放在Assets 文件夹中以实现将h5代码打包为apk
¥15 使用小程序wx.createWebAudioContext()开发节拍器

关于#python#的问题：安装第三方扩展库jieba，用该库所提供的一些方法，分词后统计每个词的出现次数，每行显示5个字词的统计结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新