m0_56302292 2023-12-08 12:09 采纳率: 76.5%
浏览 12
已结题

'list' object has no attribute 'decode'

文本分词错在哪里,怎么修改,不太理解

import jieba,jieba.analyse,numpy as np
jieba.analyse.set_stop_words(r'D:\OneNote 笔记本\大四\stop_words.txt')
text='''我们斗鱼使用文本摘要的应用程序进行交互。
应用程序中的许多都是用于发布有关每日新闻,娱乐和体育的文章的平台。
由于我们的日常安排很忙,因此我们决定在阅读全文之前先阅读这些文章的摘要。
阅读摘要有助于我们确定感兴趣的领域,摘要提供故事的简要背景信息。'''

content=text.strip('。\n').split('。\n')
temp=''.join(jieba.analyse.extract_tags(content,topK=10))
lis=temp.split()
X=np.zeros((len(content),len(lis)))
for i in range(len(content)):
    for j in range(len(lis)):
        X[i,j]=content[i].count(lis[j])



  • 写回答

2条回答 默认 最新

  • micthis 2023-12-08 12:33
    关注

    函数extract_tags(self, sentence, topK=20, withWeight=False, allowPOS=(), withFlag=False)的参数sentence应该是个文本句子。

    import jieba,jieba.analyse,numpy as np
    jieba.analyse.set_stop_words(r'D:\OneNote 笔记本\大四\stop_words.txt')
    text='''我们斗鱼使用文本摘要的应用程序进行交互。
    应用程序中的许多都是用于发布有关每日新闻,娱乐和体育的文章的平台。
    由于我们的日常安排很忙,因此我们决定在阅读全文之前先阅读这些文章的摘要。
    阅读摘要有助于我们确定感兴趣的领域,摘要提供故事的简要背景信息。'''
    content=text.strip('。\n').split('。\n')
    lis=jieba.analyse.extract_tags(''.join(content),topK=10)
    #temp=''.join(jieba.analyse.extract_tags(content,topK=10))
    #lis=temp.split()
    X=np.zeros((len(content),len(lis)))
    for i in range(len(content)):
        for j in range(len(lis)):
            X[i,j]=content[i].count(lis[j])
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月16日
  • 已采纳回答 12月8日
  • 创建了问题 12月8日