强扭的甜不瓜 2022-06-15 17:32 采纳率: 75%
浏览 34
已结题

python关于垃圾短信过滤的代码报错 求解决方法


import pandas as pd
data=pd.read_table('D:/机器学习课程设计/noteData.txt',sep='\t',header=None,nrows = 10000,names=["标签","短信内容"])
data.head()
import jieba
jieba.setLogLevel(jieba.logging.INFO)
data['分词后数据']=data["短信内容"].apply(lambda x:' '.join(jieba.cut(x)))
data.head()
X = data['分词后数据']
y = data['标签']
f = open('D:/机器学习课程设计/my_stop_words.txt','r')
my_stop_words_data = f.readlines()
f.close()
my_stop_words_list=[]
for each in my_stop_words_data:
    my_stop_words_list.append(each.strip('\n'))
    X = data['分词后数据']
    y = data['标签']
from sklearn.model_selection import StratifiedKFold
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline

skf = StratifiedKFold(n_splits=10, random_state=1, shuffle=True)

for train_index, test_index in skf.split(X, y):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

    pipeline = Pipeline([
        ('vect', TfidfVectorizer(stop_words=my_stop_words_list)),
        ('clf', MultinomialNB(alpha=1.0))])

    pipeline.fit(X_train, y_train)

    # 进行预测
    predict = pipeline.predict(X_test)
    score = pipeline.score(X_test, y_test)
    print(score)
data["数据类型"] = pipeline.predict(X) #lambda x:x+1 if not 2==1 else 0
data['数据类型']=data["数据类型"].apply(lambda x:"垃圾短信" if x==1 else "正常短信")
data.head()

img


可以帮我看一下这段代码吗 总是出现这样的报错 有什么办法可以解决吗?

  • 写回答

2条回答 默认 最新

  • 白驹_过隙 算法领域新星创作者 2022-06-15 17:38
    关注

    这不是错误,是警告不影响运行
    可以使用以下命令取消所有警告

    import warnings
    warnings.filterwarnings("ignore")
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 6月27日
  • 已采纳回答 6月19日
  • 创建了问题 6月15日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题