用nltk去停用词如何分行？(语言-python)

想用nltk库进行数据的预处理，发现数据在分词完成时还是能正常按各条数据分行的，但去停用词后全都合成了一行，这个该怎么解决呢？
问题部分代码如下，都是从论坛找的，能正确运行：

（前面部分清理得到数据t）
#分词并删除停用词
stop_words = set(stopwords.words('english'))
word_tokens = word_tokenize(t)
filtered_sentence = [w for w in word_tokens if not w in stop_words]
print(filtered_sentence)

原始数据为：
能分条

去停用词后：
全合成一行

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-HGJ 2022-02-18 15:56

关注

可以用for循环写成嵌套列表进行处理，示例如下，获取按行去除停用词的分词结果，并可以直接写入csv或者excel中：

from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
import pandas as pd

example_sent = """This is a sample sentence,showing off the stop words filtration.\n Hello guys!"""

stop_words = set(stopwords.words('english'))

word_tokens = [word_tokenize(x) for x in example_sent.split('\n')]
filtered_sentence = []
for wd in word_tokens:
    cent=[]
    for w in wd:
        if w not in stop_words:
            cent.append(w)            
    filtered_sentence.append(cent)
print(word_tokens)
print(filtered_sentence)
df=pd.DataFrame(filtered_sentence)
print(df)

运行结果：

 0       1         2     3        4     5      6           7     8
0   This  sample  sentence     ,  showing  stop  words  filtration     .
1  Hello    guys         !  None     None  None   None        None  None

如有帮助和启发，请点采纳。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

用nltk去停用词如何分行？(语言-python) nlp python 数据分析有问必答
2022-02-18 14:27

回答 2 已采纳可以用for循环写成嵌套列表进行处理，示例如下，获取按行去除停用词的分词结果，并可以直接写入csv或者excel中： from nltk.corpus import stopwords from nl
LDA模型运行时报错，如何解决？(语言-python) nlp python 有问必答自然语言处理
2022-03-08 09:36

回答 2 已采纳可能是路径中包含中文，在操作文件的过程中会因为中文字符的原因导致无法找到正常的路径，因此会出现 Users\ + xe6…那些报错。
python中下载安装好nltk后，为什么引入类时，WordPunktTokenizer可以，PunktWordTokenizer却不行？ python 有问必答自然语言处理
2022-01-12 10:17

回答 1 已采纳新版本将PunktWordTokenizer导入路径改了，下面是PunktWordTokenizer导入方式 from nltk.tokenize.punkt import PunktSentence
【停用词】NLP中的停用词怎么获取？我整理了6种方法
2023-07-08 08:35

马哥python说的博客马哥原创：6种获取停用词的方法
用anaconda3下的nltk怎么在pycharm里使用 python 自然语言处理
2022-03-22 15:12

回答 1 已采纳如果nltk 在 anaconda3 工作正常。试试把pycharm 的python interpreter 指向 anaconda3 的python.exe 。打开项目后菜单路径【文件-设
使用nltk删除文件夹内所有txt文档的stopwords python 自然语言处理
2022-03-06 21:38

回答 1 已采纳这个语句，没有产生正确的文件路径吧？ file = open(loop_dir + txt) 改成这样试试 file = open(loop_dir +"/"+ txt) for txt in o
nltk库分词后有多余的符号分到单词里 nlp python 自然语言处理
2022-05-06 01:36

回答 1 已采纳如果只是点无法识别的话，可以先用replace()把点替换成空格，再去分词。
ryuzaki_bot：使用NLTK和scikit-learn的Python中的简单聊天机器人
2021-02-03 04:25

实作这个聊天机器人是用Python3编写的，主要使用： NLTK：是自然语言处理（NLP）和人工智能库。 NLTK用于文本预处理（消除噪声，停用词，词干和词形去除）。请访问了解更多信息。 scikit-learn：是一个数据挖掘和...
Python 英文组合词提取或者是英文单词查错 python 有问必答
2021-06-25 10:50

回答 1 已采纳用nltk分词是没问题的，但是要分词之后组合成词语，这个要用模型实现了，你可以试试word2dev试试如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
JupyterNotebook导入nltk.book报错lookup error 自然语言处理
2019-03-29 11:35

回答 2 已采纳【已解决】需要将下载的nltk数据包放置在anaconda安装目录下。在jupyter notebook中才能成功import。 ![图片说明](https://img-ask.csdn.net/u
用python将英文短文拆分成句子 python
2022-07-23 23:59

回答 1 已采纳你看看句子之间除了句号（.）以外，是不是还有一个空格或换行。如果是的话，就根据组合来拆分，比如 split('. ') 或 split('.\n')如果还是不行的话，缩写的特征一般都是一个字母加一个点
使用Python中的NLTK和spaCy删除停用词与文本标准化
2019-09-08 23:46

磐创 AI的博客概述了解如何在Python中删除停用词与文本标准化，这些是自然语言处理的基本... 在Python中使用NLTK，spaCy和Gensim库进行去除停用词和文本标准化介绍多样化的自然语言处理(NLP)是真的很棒，我们以前从未...
安装Python插件 python
2022-08-12 16:18

回答 4 已采纳 Python插件安装找到Python的安装目录。打开CMD控制台输入 python Python插件安装-LMLPHP 打开环境变量，找到Python安装路径。 Python插件安装-LMLPHP
NLP-统计词频之处理停用词
2023-02-27 10:23

写python的鑫哥的博客本文是该专栏的第1篇，后面会持续分享NLP的各种干货知识，值得关注。一般来说，自然语言处理（NLP）就是开发能够...现阶段，自然语言工具包最受欢迎的自然语言处理库是，其是用python编写的，有着非常强大的社区支持。
机器学习自然语言处理之英文NLTK（代码+原理）
2022-05-20 21:12

王小王-123的博客常用的自然语言处理技术NLTK简介NLTK的功能分词过滤掉停用词词汇规范化（Lexicon Normalization）1）词形还原（lemmatization）2) 词干提取（stem）词性标注获取近义词其他案例每文一语什么是自然语言处理？自然...
Python自然语言处理：NLTK入门指南
2023-05-14 08:18

格林希尔的博客它是一门多学科交叉的学科，将计算机科学、人工智能、语言学等诸多学科的理论和方法融合在一起，将人类语言转化为计算机所能理解的形式，实现对人类语言的自动处理、理解和生成。NLP可以应用到很多方面，比如语音...
【小沐学NLP】Python使用NLTK库的入门教程
2023-09-03 02:03

爱看书的小沐的博客 NLTK - 自然语言工具包 - 是一套开源Python。支持自然研究和开发的模块、数据集和教程语言处理。NLTK 需要 Python 版本 3.7、3.8、3.9、3.10 或 3.11。NLTK是一个高效的Python构建的平台，用来处理人类自然语言数据...
中文停用词词表-自然语言处理
2022-05-17 19:59

python风控模型的博客自然语言处理-停用词表机器学习论文参考案例：www.mlpaper.cn/ 商务建模合作邮箱：231469242@qq.com 加QQ群：1026993837，免费领取python学习资料原创公众号python风控模型
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月18日

悬赏问题

¥500 火焰左右视图、视差（基于双目相机）
¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本

用nltk去停用词如何分行？(语言-python)

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新