Python中用snownlp库进行情感分析，要求增加情感类别对不同情感进行标记。

在情感分析时，将情感程度划分成三个区间，分别是[0,0.4)为消极倾向，[0.4,0.6)为中性倾向，[0.6,1]为积极倾向，都保留6位小数，以便能够直观地观察每个评论语句的情感态度，表 2 选取了几个极具代表性的语句，如表 2所示。
在现有的代码中增加情感类别这一内容。

#导入数据分析需要的包
import pandas as pd
#可视化包9
import matplotlib.pyplot as plt
from snownlp import SnowNLP

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

# 导入数据集
data = pd.read_csv('sf02_data.csv')

#主要分析评论情感，只截取部分字段
data1 = data[['sf_content', 'sf_creationTime']]

#把sf_creationTime转换为时间序列类型
data1['sf_creationTime'] = pd.to_datetime(data1['sf_creationTime'])

#因为该数据集时间跨度比较长，这里值选择其中一年的评论
data1 = data1[(data1['sf_creationTime'] < pd.to_datetime('20231231')) & (data1['sf_creationTime'] > pd.to_datetime('20230101'))]

#并且以月份作为x轴显示
data1['sf_creationTime'] = data1['sf_creationTime'].dt.month
data1.head(10)

#定义函数
def get_sentiment_cn(text):
    s = SnowNLP(text)
    return s.sentiments

# 应用函数
data1["sentiment"] = data1.sf_content.apply(get_sentiment_cn)
data1.head(10)

#查看整体评分以及分布状态
data1.sentiment.describe()

#查看时间序列评论情感分布，这里查看的是2023年各月份评论情感分布
data01 = data1[['sf_creationTime','sentiment']]
data01.boxplot(by='sf_creationTime',figsize=(20,10))
plt.title('2023年各月份评论情绪分布')
plt.xlabel('月份')
plt.ylabel('sentiment')
plt.show()

#查看情感得分最低的一条评论
data1.sort_values(by=['sentiment'], ascending=[True])[:1]

#查看这条评论的完整内容
print(data1.sort_values(['sentiment']).iloc[0].sf_content)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
笑面虎 2024-05-13 20:19
关注
以下内容由CHATGPT及笑面虎共同生成、有用望采纳：

【您想要解决的问题】：您的目的是在Python中使用snownlp库进行情感分析，并根据情感评分将情感类别划分为三个区间：消极、中性、积极。您需要在现有的代码中增加一个功能，以便能够根据情感评分自动标记每个评论语句的情感类别。

【图片内容】：您上传的图片是一张表格，展示了几个评论样本及其情感评分和情感类别。表格中列出了评论人、评论日期、评论内容、情感评分和情感类别。

【问题出现原因】：问题出现的原因是您现有的代码可以计算情感评分，但还没有实现根据评分自动将评论语句分类到相应的情感类别（消极、中性、积极）的功能。

【问题解决方案】：为了解决这个问题，您需要在代码中添加一个部分，这部分将根据情感评分为每条评论语句分配一个情感类别。具体来说，您需要定义一个函数或逻辑，根据您提供的评分区间来分类情感。

【提供代码】：以下是修改后的代码，其中包含了根据情感评分自动分类情感类别的部分：

# 其他代码保持不变 # 定义情感类别的函数 def categorize_sentiment(score): if score < 0.4: return '消极' elif 0.4 <= score < 0.6: return '中性' else: return '积极' # 应用函数，为每条评论添加情感类别 data1['sentiment_category'] = data1.sentiment.apply(categorize_sentiment) # 其他代码保持不变 # 展示结果，包括情感类别 data1[['sf_content', 'sentiment', 'sentiment_category']].head(10)

【代码运行方式】：您需要在一个Python环境中运行这段代码，这个环境需要安装有pandas、matplotlib和snownlp库。您可以使用Jupyter Notebook或任何其他Python IDE来运行这段代码。

【代码预期运行结果】：代码运行后，您将看到一个新的列 sentiment_category，它将显示每条评论的情感类别，可以是“消极”、“中性”或“积极”。

【推荐相关链接】：

snownlp GitHub
Python官方文档
Pandas官方文档
Matplotlib官方文档
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python二级考试试题汇总（史上最全）
2021-07-30 09:04

编程ID的博客 Python语言是一种脚本编程语言 B 汇编语言是直接操作计算机硬件的编程语言 C 程序设计语言经历了机器语言、汇编语言、脚本语言三个阶段 D 编译和解释的区别是一次性翻译程序还是每次执行时都要翻译程序正确答案： C...
Python常用第三方库大全, 值得收藏!
2021-08-13 08:00

大江狗的博客 Python的强大之处除了它的简洁易用，最厉害的就是它有着广泛的第三方库支持。今天小编就带你看下Python有哪些常用第三库吧,知道且用过超过10个的欢迎留言~文本处理与格式转换Char...
Python 学习 ---＞模块、pypi ( 模块库 )、添加模块路径
2016-03-21 22:46

擒贼先擒王的博客在 Python 中，一个.py文件就是一个模块（Module）。模块的名字就是文件的名字。在模块内部，通过全局变量__name__可以获取模块名（即字符串）模块作用为了实现代码的复用，通常会把一些其他程序中重用的代码拿...
可爱的python测试开发库(python测试开发工具库汇总)
2018-10-22 05:59

weixin_34054931的博客 2019独角兽企业重金招聘Python工程师标准>>> ...
[雪峰磁针石博客]可爱的python测试开发库
2018-08-18 23:52

weixin_34391445的博客欢迎转载，转载请注明来源：github地址谢谢点赞相关书籍下载测试开发 Web UI测试自动化 splinter - web UI测试工具，基于selnium封装。...mechanize- Python中有状态的程序化Web浏览。链接 selene - 使用P...
NLP自然语言处理干货贴
2016-10-02 02:05

ABC080914的博客 1.OCR技术浅探：9. 代码共享(完) 摘要：作者：苏剑林来源网站：科学空间原文链接：OCR技术浅探：9. 代码共享(完) 文件说明： 1.... 2.OCR技术浅探：8.... 摘要：作者：苏剑林 ... 语言模型摘要：作者：苏剑林来源网站
机器学习代码整理pLSA、BoW、DBN、DNN
2019-04-04 09:38

lusic01的博客在图上，每一个红色的点，都表示一个词，每一个蓝色的点，都表示一篇文档，这样我们可以对这些词和文档进行聚类，比如说 stock 和 market 可以放在一类，因为他们老是出现在一起，real 和 estate 可以放在一类，dads...
Python所有库及作用（写程序必备）
2022-03-31 07:43

门柚的博客 difflib，[Python]标准库，计算文本差异 Levenshtein，快速计算字符串相似度。 fuzzywuzzy,字符串模糊匹配。 esmre,正则表达式的加速器。 shortuuid,一组简洁URL/UUID函数库。 ftfy，Unicode文本工具7 unideco
python语言程序设计二级
2024-07-06 14:54

2401_86114424的博客亲爱的读者们，今天我们要讨论，二级python语言程序设计模拟题库 Python语言程序设计二级有什么用，一起探索吧！
python编程基础与案例集锦,python编程案例教程答案
2024-06-05 13:11

2401_84667743的博客以下关于程序设计语言的描述，错误的选项是： A Python语言是一种脚本编程语言 B 汇编语言是直接操作计算机硬件的编程语言 C 程序设计语言经历了机器语言、汇编语言、脚本语言三个阶段 D 编译和解释的区别是一次性...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月13日

Python中用snownlp库进行情感分析，要求增加情感类别对不同情感进行标记。

3条回答 默认 最新

问题事件

3条回答默认最新