nltk库分词后有多余的符号分到单词里

book="Harry Potter and the Sorcerer's Stone.txt"

from nltk import word_tokenize,pos_tag #分词、词性标注
from nltk.corpus import wordnet
from nltk.stem import WordNetLemmatizer #词性还原

book_datas=''
with open(book,encoding='utf-8') as fd:
for line in fd.readlines():
book_datas +=line

words= word_tokenize(book_datas)

这是准备用nltk将单词割分，然后减去标点符号和停用词，但是在交互窗口运行了一下发现出现了'that.When'，'nonsense.Mr'， 'anywhere.The',之类很显然的错误呢，我又该怎么办呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请叫我问哥新星创作者: python技术领域 2022-05-06 10:59
关注
如果只是点无法识别的话，可以先用replace()把点替换成空格，再去分词。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python之nltk分词库使用
2025-01-07 14:40

孟船长的博客介绍了nltk分词库的主要使用方法
【小沐学NLP】Python使用NLTK库的入门教程
2023-09-03 02:03

爱看书的小沐的博客它提供了易于使用的接口，通过这些接口可以访问超过50个语料库和词汇资源（如WordNet），还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库，以及工业级NLP库的封装器和一个活跃的讨论论坛。
基于 Scikit - learn 和 NLTK 的文本分类系统的 Python 源码
2025-03-05 08:36

在现代信息处理领域中，文本分类技术扮演着至关重要...无论对于研究者还是开发者，这样的系统都是一个极具吸引力的工具，它能够显著提高文本处理的效率和准确性，为人工智能在自然语言处理领域的应用开辟了新的可能性。
Python----NLP自然语言处理（英文分词器--NLTK)
2025-07-13 11:22

蹦蹦跳跳真可爱598的博客 NLTK是Python中处理英文文本的重要工具包，主要功能包括分词、词形还原、词性标注和停用词过滤等。它通过word_tokenize进行分词，使用WordNetLemmatizer实现词形还原（如将"better"还原为"good"...
人工智能_项目实践_分词词库_分词词库（中英文）
2022-03-27 16:24

在实际项目中，这些分词词库可以被各种NLP工具或库所使用，例如Python的jieba库用于中文分词，NLTK或Spacy库用于英文分词。"funNLP-master.zip"这个文件很可能是一个包含实用NLP工具或示例代码的资源包，可能提供了...
分词 nltk 词性
2025-07-05 00:08

AI算法网奇的博客分词 nltk 词性
NLTK中文分句自定义词典 Mr. 不分词
2021-12-09 16:58

Answerlzd的博客因为我这里已经下载过NLTK了，所以就不提供安装教程了，搜一搜都能找到。这里就直接演示对英文句子切分： from nltk.tokenize.punkt import PunktSentenceTokenizer, PunktParameters def cut_sentences_en...
NLP之nltk：基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现
2019-03-07 16:43

一个处女座的程序猿的博客 NLP之nltk：基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现。
NLTK语料库
2025-01-06 10:00

Mr数据杨的博客通过本教程，读者可以了解到如何使用NLTK的语料库来进行自然语言处理任务。NLTK不仅提供了丰富的内置语料库，还为文本处理、语法分析、语义分析等提供了高效的工具和方法。在实际应用中，语料库的数据能帮助快速构建...
【自然语言处理（NLP）】NLTK的使用（分句、分词、词频提取）
2025-01-24 05:00

道友老李的博客 NLTK全称是NaturalLanguageToolkit（自然语言处理工具包），它是一个用于构建处理人类语言数据的Python程序的领先平台。NLTK提供了简单易用的接口以及丰富的工具和资源，广泛应用于文本处理、信息检索、情感分析、...
Python自然语言处理：NLTK库入门
2025-07-20 21:03

AI Python 编程的博客 NLTK就像一把“语言解剖刀”，帮你看清文本的“内部结构”。从今天开始，动手拆解一段文本吧——你会发现，文字背后的规律比想象中更有趣！
NLTK：一个强大的自然语言处理处理Python库
2024-09-09 22:09

东哥说AI的博客 NLTK，全称Natural Language Toolkit，即自然语言处理工具包。...NLTK库包含了大量的语料库、词汇资源、分类器、语法分析器等，可以帮助我们进行文本分类、词性标注、命名实体识别、情感分析等各种自然语言处理任务。
python里的nltk库_python3怎么应用nltk自然语言处理库
2020-12-21 14:12

weixin_39593523的博客匿名用户1级2017-07-28 回答自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言工具箱(NLTK，Natural Language Toolkit)是一个基于Python语言的类库，它也是当前最为流行的自然语言编程与开发...
NLTK库全解析：用Python打开自然语言处理的第一把钥匙
2025-07-02 01:20

小张在编程的博客优点入门友好，文档和教程丰富，...功能全面，覆盖分词、标注、分类等全流程。缺点性能相对较低，不适合处理大规模数据；中文支持较弱，复杂任务需结合其他库；部分模型（如NER）精度不如专业工具（如spaCy、Flair）。
Python自然语言处理（NLP）库之NLTK使用详解
2024-05-28 09:48

Rocky006的博客自然语言处理（NLP）是人工智能和计算机科学中的一个重要领域，涉及对人类语言的计算机理解和处理。Python的自然语言工具包（NLTK，Natural Language Toolkit）是一个功能强大的NLP库，提供了丰富的工具和数据集，...
NLTK模块使用教程
2024-11-01 10:52

智启七月的博客一、NLTK的安装+简介（1）、NLTK安装（2）、NLTK模块功能（3）、NLTK中的语料库（4）、加载语料库（5）、基础语法二、NLTK词频统计（Frequency）三、NLTK去除停用词（stopwords）四、NLTK分词和分句...
NLTK库开发资源包：深入自然语言处理
2025-07-23 21:28

长野君的博客自然语言处理（Natural Language Processing, NLP）是计算机科学、人工智能和语言学领域的交叉学科。NLTK（Natural Language Toolkit）是一个强大的Python库，它提供了一系列用于符号和统计自然语言处理的库和程序，...
python自然语言处理分词_Python编程使用NLTK进行自然语言处理详解
2020-11-29 07:18

weixin_39736913的博客自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言工具箱（NLTK，NaturalLanguageToolkit）是一个基于Python语言的类库，它也是当前最为流行的自然语言编程与开发工具。在进行自然语言处理研究...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月6日

nltk库分词后有多余的符号分到单词里

1条回答 默认 最新

问题事件

1条回答默认最新