python关于垃圾短信过滤的代码报错求解决方法


import pandas as pd
data=pd.read_table('D:/机器学习课程设计/noteData.txt',sep='\t',header=None,nrows = 10000,names=["标签","短信内容"])
data.head()
import jieba
jieba.setLogLevel(jieba.logging.INFO)
data['分词后数据']=data["短信内容"].apply(lambda x:' '.join(jieba.cut(x)))
data.head()
X = data['分词后数据']
y = data['标签']
f = open('D:/机器学习课程设计/my_stop_words.txt','r')
my_stop_words_data = f.readlines()
f.close()
my_stop_words_list=[]
for each in my_stop_words_data:
    my_stop_words_list.append(each.strip('\n'))
    X = data['分词后数据']
    y = data['标签']
from sklearn.model_selection import StratifiedKFold
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline

skf = StratifiedKFold(n_splits=10, random_state=1, shuffle=True)

for train_index, test_index in skf.split(X, y):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

    pipeline = Pipeline([
        ('vect', TfidfVectorizer(stop_words=my_stop_words_list)),
        ('clf', MultinomialNB(alpha=1.0))])

    pipeline.fit(X_train, y_train)

    # 进行预测
    predict = pipeline.predict(X_test)
    score = pipeline.score(X_test, y_test)
    print(score)
data["数据类型"] = pipeline.predict(X) #lambda x:x+1 if not 2==1 else 0
data['数据类型']=data["数据类型"].apply(lambda x:"垃圾短信" if x==1 else "正常短信")
data.head()

可以帮我看一下这段代码吗总是出现这样的报错有什么办法可以解决吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
白驹_过隙新星创作者: 算法与数据结构技术领域 2022-06-15 17:38
关注
这不是错误，是警告不影响运行
可以使用以下命令取消所有警告

import warnings warnings.filterwarnings("ignore")
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【2023最新】超详细！！！python解决代码报错的四个方法保证看完学会并且解决代码报错
2023-11-11 23:11

大聪明_花的博客 python代码报错解决的四个方法，包括如何搜索关键词返回的是自己想要的文章，以及GPT的使用方法，看Gitee和Githup源码
【Python】解决Python报错：SyntaxError: invalid character in identifier
2024-05-29 19:31

I'mAlex的博客解决Python报错：SyntaxError: invalid character in identifier
基于 python+YoloV4算法检测绝缘子-人工智能课程设计
2025-11-12 09:58

【作品名称】：基于 python+YoloV4算法检测绝缘子-人工智能课程设计【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】： ...
CPU上利用python运行onnx报错
2025-07-13 23:01

楚潸潸的博客考虑重装onnxruntime库，与重新转换onnx模型。遇到输出大量nan报错。
【Python报错已解决】libpng warning: iccp: known incorrect sRGB profile
2024-09-20 12:57

鸽芷咕的博客在处理图像文件，特别是PNG格式的图像时，你可能会遇到一个名为“libpng warning: iccp: known incorrect sRGB profile”的警告。这个警告通常与图像文件的色彩...本文将帮助你理解这个警告的原因，并提供解决方案。
【Python报错已解决】TypeError: ‘NoneType‘ object is not iterable
2024-10-28 20:20

鸽芷咕的博客在Python开发的世界里，报错信息就像隐藏在代码迷宫中的陷阱，常常让开发者们猝不及防。其中，TypeError: 'NoneType' object is not iterable这个报错，犹如一个狡猾的幽灵，在各种看似合理的代码中悄然现身，导致...
学Cursor写Python代码：靠AI学习助理，从“抄代码”到“写对代码”
2026-01-09 10:07

yuhaiqun1989的博客本文分享了一位Python零基础学习者通过B站《Cursor保姆级使用教程》学习AI编程的实践心得。初期遇到"看视频会、动手废"的困境，表现为Prompt编写不精准、环境部署困难、代码验证无头绪等问题。通过结构化...
基于文本内容的垃圾短信识别实战
2023-07-18 01:22

慕.晨风的博客基于文本内容的垃圾短信识别实战
《用DeepSeek+Python零代码基础打造智能抽奖系统》- 含完整源码及50+报错解决方案)
2025-03-12 20:33

蓝鲸忘了海的博客欢迎在评论区留下你的报错信息，获取定制化解决方案！遇到未列出的问题？// 使用DeepSeek的AI验证前端输入。
《人工智能》—— Python编程语言
2024-07-09 11:48

晋济周的博客 Python基本语法与数据类型Python语言基本语法t = input('请输入带符号的温度值：') # 用键盘输入温度值print('转换后的温度是{:.2f}C'.format(c))print('转换后的温度是{:.2f}F'.format(f))else:print("输入格式错误...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月15日

python关于垃圾短信过滤的代码报错 求解决方法

2条回答 默认 最新

问题事件

python关于垃圾短信过滤的代码报错求解决方法

2条回答默认最新