遍历每条评论，根据关键词进行权重相加

1、使用TF-IDF算法提取到关键词并获得权重；
2、将关键词进行分类，分了8大类；
3、每类中包含几个关键词并附带权重；
问题：如何遍历每条评论分别计算8类的总权重，并导入到excel表格？
表格表头为：评论——类1权重和——类2权重和——

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

IT_service_mesh 2023-03-25 16:40

关注

参考GPT和自己的思路：为遍历每条评论，根据关键词进行权重相加并导入到excel表格，你可以按照以下步骤进行操作：

首先，你需要使用TF-IDF算法从每条评论中提取出关键词，并计算出这些关键词的权重。
将提取出的关键词进行分类，将它们分为8大类。你可以自行定义每个类别的关键词，并将它们存储为一个字典。
编写一个函数，将每一类的关键词及其权重存储在一个字典中，并将这个字典嵌套在一个列表中。这样，你可以很方便地对每一类关键词的权重进行累加。
对每条评论进行遍历，将评论中的关键词与你事先定义好的关键词分类列表进行匹配。如果该关键词属于某个类别，将其权重添加到该类别的权重和中。
为每条评论记录在表格中的8类权重和，你可以定义一个空的字典或列表，每当遍历一条评论时，将该评论的8类权重和记录在这个字典或列表中。当所有评论都处理完毕后，你可以将这些记录导入到excel表格中。

下面是一个简单的Python代码示例，它实现了上述步骤中的某些操作。

import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer

# 评论数据集合
text_data = [
    '这个电影很好看。',
    '这部电影太过无聊了。',
    '导演的表现非常出色。',
    '这个演员的表演令人印象深刻。',
]

# 定义关键词和类别
category_keywords = {
    '类别1': ['电影', '导演', '演员'],
    '类别2': ['好看', '出色', '印象深刻'],
    # ... 其他类别
}

# 定义每一类别的关键词及其权重
category_weights = [
    {'关键词1': 0.1, '关键词2': 0.2},
    {'关键词3': 0.3, '关键词4': 0.4},
    # ... 其他类别
]

# 提取关键词并计算权重
tf_idf = TfidfVectorizer(stop_words='english')
features = tf_idf.fit_transform(text_data)
vocabulary = tf_idf.vocabulary_
weights = features.todense()

# 遍历每条评论，计算8类的总权重，并将结果记录在字典中
results = []
for i in range(len(text_data)):
    class_weights = np.zeros(len(category_weights))
    for k, v in vocabulary.items():
        if k in category_keywords['类别1']:
            class_weights[0] += weights[i, v] * category_weights[0][k]
        elif k in category_keywords['类别2']:
            class_weights[1] += weights[i, v] * category_weights[1][k]
        # ... 其他类别
    results.append({'评论': text_data[i], '类1权重和': class_weights[0], '类2权重和': class_weights[1], ...})

# 将结果导入到excel表格中
df = pd.DataFrame(results)
df.to_excel('results.xlsx')

请根据实际需求进行修改和优化。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

遍历每条评论，根据关键词进行权重相加 python 数据挖掘
2023-03-25 16:25

回答 1 已采纳参考GPT和自己的思路：为遍历每条评论，根据关键词进行权重相加并导入到excel表格，你可以按照以下步骤进行操作：首先，你需要使用TF-IDF算法从每条评论中提取出关键词，并计算出这些关键词的权重。
python如何遍历指定目录并检测关键词？ python 有问必答
2021-10-01 10:27

回答 2 已采纳可以进行一下分词，然后对词库的词进行匹配，有则输出1，没有输出0
vue遍历对象时候如何获取每个schedule对象id的值并且相加 ajax javascript json vue.js
2019-06-26 22:54

回答 2 已采纳是要这样的吗？ ```js const schedules = [ { id: 1, value: 100 }, { id: 2, value: 200 }, { id: 3,
人工智能 -- NLP 关键词提取：TF-IDF算法和 TextRank算法
2019-11-30 18:11

Acegem的博客 人工智能 – NLP 关键词提取：TF-IDF 和 TextRank算法 1.基于TF-IDF算法进行关键词抽取 from jieba import analyse # 引入TF-IDF关键词抽取接口 tfidf = analyse.extract_tags # 原始文本 text = "\u3000\u...
安卓ListView如何遍历每个Item保存我每条上添加的数据 android list
2015-10-26 01:27

回答 4 已采纳最简单的方式是用hashmap记录，key为position，你要去实时的记录用户编辑的情况，比方说edittext，在getview里监听textchange，然后改变的时候，把position和内
请问“遍历包含特定关键词的本地文件并将其存储到新的文件夹”该如何做？ python
2021-08-25 10:01

回答 1 已采纳用os.walk查题目就遍历filename，如果查内容就一次with open对应文件，然后用 if “你好” in file_text的方式查找对于找到的文件，使用shutil包的move函数即可
多维数组遍历后某个字段相加 javascript node.js vue.js
2023-01-17 15:05

回答 7 已采纳 res_data.forEach(item=>{ if (item.goods_list.length > 0) { item.goods_list.forEach
【路由算法】如何对所有边按照权重进行排序，实现网络的数据包进行重新分配和调度，使得流量可以更加均匀地分布到整个网络上？
2023-09-22 01:24

禅与计算机程序设计艺术的博客为了解决这个问题，路由协议会根据不同网络拓扑结构、链路质量、负载状况等因素，对进入网络的数据包进行重新分配和调度，使得流量可以更加均匀地分布到整个网络上。传统的路由算法通常采用启发式的方式，比如路由表...
python遍历数组元素进行修改的方法 python 有问必答
2022-04-10 13:22

回答 3 已采纳因为不指定下标的话，每次修改的没有实际生效你写的只是单纯取值，great_magicians[i] 才能对应到实际列表
遍历读取每个文件夹下的TXT文件 python 有问必答
2022-03-18 19:49

回答 2 已采纳 file 只是文件名,要用 os.path.join(path, file) 在文件名前拼接上文件夹路径你题目的解答代码如下： path = '文件夹路径' files = [] for file
foreach为什么只遍历出了一条数据 eclipse java
2022-05-18 00:58

回答 3 已采纳先把li标签去掉看能出几条数据
图论基本概念及存储结构、遍历方式
2021-07-10 15:09

踩踩踩从踩的博客应用在交通网络中，以及人工智能这些，任务分配的思想，都需要以图为基础，因此研究图论也是非常重要的，本篇文章主要介绍图论一些基本概念、基本性质、存储结构、以及遍历方式、为深层次研究图论打下一个基础。
动态遍历结构中的每个字段并进行更改
2018-06-14 18:05

回答 1 已采纳 To modify the struct value in the caller, change the function to take a pointer to the struct valu
Unity人工智能编程精粹学习笔记实现AI角色的自主移动——操控行为
2021-02-22 19:39

漫漫无期的博客它属于AI模型中的运动层。（1）操控行为包括一组基本“行为”。对于单独的AI角色，基本操控行为包括：使角色靠近或离开目标的“Seek”，“Flee”行为；当角色接近目标时使他减速的“Arrival”行为；使捕猎者...
深度学习知识点全面总结
2022-01-05 16:29

GoAI的博客本文详细介绍深度学习概念及原理，参考网上相关资料汇总，内容包含众多章节，包括神经网络基础及常见深度学习网络结构介绍，用于个人学习...常见的监督学习算法：感知机、SVM、人工神经网络、决策树、逻辑回归.........
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月25日

悬赏问题

¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测

遍历每条评论，根据关键词进行权重相加

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新