python文本分析报错

想请教一下为什么会出现这种报错？
我是不是需要再建立一个excel文档来命名我的结果？
不是很懂，麻烦请教各位。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Roc-xb 后端领域优质创作者 2024-09-17 02:00

关注

这个错误信息表明变量 new_data 未定义。这可能是因为 re.findall 返回了一个空列表，导致 join 操作结果为空字符串。

import re
import jieba

def chinese_word_cut(mytext):
    jieba.load_userdict('add_word_list.txt')
    jieba.initialize()
    
    # 找到文本中的所有中文字符
    new_data = re.findall(r'[\u4e00-\u9fa5]+', mytext, re.S)
    
    # 检查 new_data 是否为空
    if new_data:
        new_data = " ".join(new_data)
    else:
        new_data = ""
    
    seg_list_exact = jieba.cut(new_data, cut_all=True)
    result_list = []
    
    with open('stopwordlist.txt', encoding='utf-8') as f:
        con = f.readlines()
        stop_words = set()
        for i in con:
            i = i.replace("\n", "")
            stop_words.add(i)
    
    for word in seg_list_exact:
        if word not in stop_words and len(word) > 1:
            result_list.append(word)
    
    return " ".join(result_list)

# 示例使用
# data['content_cutted'] = data.content.apply(chinese_word_cut)
# data.head()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

Python数据分析报错 python
2022-05-06 22:09

回答 1 已采纳你看一下data这个数据长什么样子，它可能并没有把表格第一行读成dataframe的表头https://blog.csdn.net/Bigboss7/article/details/118597351
Python文本改写报错 python
2023-04-03 09:04

回答 3 已采纳可以使用 Python 的文件读写操作来实现。具体步骤如下：打开文本文件，将文件内容读取到一个字符串中。 with open('file.txt', 'r') as f: content =
python编程不明报错 python 有问必答
2021-12-16 10:44

回答 1 已采纳 result = ('%.8f' % result)这句会导致result变为字符串，然后第二次循环后result = result + (sign / j)这里就出错了不要赋值，直接appen就行了
Python使用googletrans报错的解决方法
2020-09-20 02:35

在Python编程中，`googletrans` 是一个广泛使用的第三方库，它提供了与Google Translate API的接口，用于实现语言之间的文本翻译。然而，由于Google经常更新其服务，有时会导致`googletrans`库出现兼容性问题，进而...
python输入数据报错 python
2022-03-16 19:19

回答 1 已采纳能把题目发一下吗
conda create -n py111 python=3.6报错 python
2022-03-21 18:23

回答 1 已采纳首先，你的3.10和3.7是在不同环境中的python，3.10是你其他路径下面的python，而3.7是anaconda环境下面的python。比较建议的是将其他环境的卸载点儿保留conda环境的p
python 中文文件名报错 pycharm python
2023-02-09 23:48

回答 3 已采纳题主，你好，pyautogui的部分函数确实不适配中文，此处的报错控制台已经给出提示信息：1.无法打开/读取文件:检查文件路径/完整性2.因为文件丢失、权限不正确或格式不受支持或无效建议题主尝试把路径
python err报错写入文本
2024-07-03 03:53

拼命阿白的博客 Python相关视频讲解：python的or运算赋值...查看python文件_输出py文件_cat_运行python文件_shelPython 错误报告写入文本在使用Python编程时，我们经常会遇到各种各样的错误。有时候，我们需要将这些错误信息记录...
python json库报错 python
2022-05-15 22:41

回答 1 已采纳打印response看看里面有没有内容
关于python的pip报错问题 python
2022-09-08 18:59

回答 3 已采纳更新一下pip版本呢
python简单输出报错了 python
2022-04-30 17:11

回答 5 已采纳 print('hello', str(i))print(f'hello{str(i)}')print('hello {}'.format(str(i)))
问题：python输出文本常见的报错原因
2024-08-12 14:21

vx1143561141的博客如果你尝试输出一个未定义的变量，Python会抛出一个NameError。错误示例pythonprint(my_variable) # 如果 my_variable 没有被定义修正。
python程序运行报错 python 有问必答
2022-06-08 16:02

回答 4 已采纳 exe文件不要放在中文路径下，容易导致乱码而找不到路径。参考方式二： selenium使用 webdriver.Chrome() 报错，找不到执行文件_测试大船团花生君的
【Python】—— 文本分析
2023-12-15 08:00

ZShiJ的博客当涉及到文本数据处理和可视化的任务时，我们可以通过了解下面的知识和使用Python的一些主要库和工具来完成这些任务。异常问题：在处理英文小说时，代码中使用了nltk库和wordcloud库，但是用户没有提前安装这两个库...
【python】pandas报错：UnicodeDecodeError详细分析，解决方案以及如何避免
2024-07-15 14:47

景天科技苑的博客在使用Pandas库进行数据处理时，我们可能会遇到各种报错。...本文将针对一种常见的Pandas运行报错进行深入分析，包括报错的具体原因、有效的解决办法以及如何避免此类错误的再次发生，并附带详细的代码示例。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月17日

悬赏问题

¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化
¥15 Mirare PLUS 进行密钥认证？（详解）
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
¥20 想用ollama做一个自己的AI数据库
¥15 关于qualoth编辑及缝合服装领子的问题解决方案探寻
¥15 请问怎么才能复现这样的图呀

python文本分析报错

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新