Python提取Excel特定关键字的句子并进行语调分析

我是为了写论文刚开始学Python，所以是带这问题学的，很多东西都不懂。我要实现的目的是将回答内容这列的文本中包含一些特定关键字的句子全部提取出来，并添加两列分别填入提取出来的句子对应的公司代码和年份。然后分析每一个单元格提取出来的句子的语调积极程度，并将语调积极程度的结果作为新的一列添加到表格中，最后输出为Excel，但是它报错了我不知道怎么解决，还烦请各位帮忙看一下怎么解决这个报错，然后就是我这个代码的逻辑是否有什么问题呢？能否达到我想要的目的呢？希望大家能帮我解答一下疑惑，非常感谢！

数据示例：

然后报错实在DataFrame那里

然后以下是我的代码

import pandas as pd
import re
from textblob import TextBlob

# 读取Excel文件
df = pd.read_excel('业绩说明会问答文本分析.xlsx')

# 定义需要匹配的关键字列表
keywords = ['推进', '发展', '提高']

# 遍历回答内容这一列，提取包含关键字的句子并添加到新的DataFrame中
matched_sentences = pd.DataFrame(columns=['Company Code', 'Year', 'Sentence'])
for i in range(len(df)):
    text = str(df.iloc[i, 2])  # 获取回答内容这一列的文本
    for keyword in keywords:
        # 在文本中查找关键字，并提取包含关键字的句子
        matches = re.findall(r'([^.]*' + keyword + '[^.]*\.)', text, re.IGNORECASE)
        # 将句子和对应的公司代码和年份添加到新的DataFrame中
        for match in matches:
            matched_sentences = matched_sentences.append({
                'Company Code': df.iloc[i, 0],
                'Year': df.iloc[i, 1],
                'Sentence': match
            }, ignore_index=True)

# 遍历匹配的句子，提取语调积极程度并添加到新的一列中
positivity_scores = []
for sentence in matched_sentences['Sentence']:
    blob = TextBlob(sentence)
    positivity_scores.append(blob.sentiment.polarity)
matched_sentences['Positivity Score'] = positivity_scores

# 将最终结果输出为Excel文件
matched_sentences.to_excel('your_output_file_path.xlsx', index=False)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Dick_不周 2023-04-21 18:32
关注
DataFrame没有append方法.
用添加行的方式可以添加

matched_sentences.loc[len(matched_sentences)] = [df.iloc[i,0],df.iloc[i,1],match]

最后，整段代码执行完能不能达到你想要的效果，这个网友还真不好判断。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python提取Excel特定关键字的句子并进行语调分析 python 机器学习自然语言处理
2023-04-21 18:11

回答 3 已采纳 DataFrame没有append方法.用添加行的方式可以添加 matched_sentences.loc[len(matched_sentences)] = [df.iloc[i,0],df.ilo
Python提取Excel中特定关键字并进行语调分析 python 机器学习自然语言处理
2023-04-21 21:54

回答 2 已采纳就是按照前两列合并？这个我帮你写了一个 import pandas as pd from openpyxl import Workbook, load_workbook from openpyxl.u
python提取excel中的特定数据 python
2022-04-09 00:12

回答 2 已采纳 import pandas as pd df=pd.read_excel('abc.xlsx') df=df.filter(regex='销售数据',axis=1) df.to_excel('bcd.
高频常问面试问题
2023-08-23 15:46

sinian_四年的博客 3 深拷贝和浅拷贝-列表实现深拷贝有哪些方法 4 抽象类和接口的区别 5 多线程的好处 6 Java GC 7 Java 特性 8 为什么 Java 是单继承 9 单例模式 10 JVM的内存溢出情况分析（堆和栈） 11 JVM运行时数据区 12 栈帧 13 ...
python读excel，提取关键字输出 python
2022-12-12 20:48

回答 1 已采纳望采纳读取 Excel 文件并筛选出满足特定条件的事件需要使用一些 Python 第三方库，如 Pandas。这些库提供了高级的数据分析功能，包括读取 Excel 文件并提取其中的数据。下面是一个示例
python从txt中提取关键字所在行，并删除重复项后生成新的txt python
2022-05-16 17:32

回答 1 已采纳尝试用了write函数，但是最终txt文件中只有最后一行数据你这里已经很接近了比如说 with open('save.txt','a') as f1: f1.write('你要写入的数据'
python 提取excel的某几列的数据 list python
2021-02-08 08:52

回答 3 已采纳 import pandas as pd file_name = r"new.xlsx" df = pd.read_excel(file_name) columns = ["a","c","e"]
流畅的 Python 第二版（GPT 重译）（二）
2024-03-20 14:51

绝不原创的飞龙的博客类和实例属性、模块命名空间和函数关键字参数是内存中由字典表示的核心 Python 构造。__builtins__.__dict__存储所有内置类型、对象和函数。由于其关键作用，Python 字典经过高度优化，并持续改进。哈希表是 Pyt
python查找文件中关键字并获取 python
2021-10-08 18:58

回答 2 已采纳用正则表达式吧，匹配字符串的神器！！
如何利用python提取含有关键字的行 python
2021-10-06 18:21

回答 1 已采纳 readlines读取文件后得到一个数组遍历数组，可以用for遍历到空行就continue匹配关键字用find函数你中间说的匹配结果是不是错了mm10哪儿来的？
请问下用python怎么在路径里面提取部分关键字 python
2022-05-04 16:57

回答 4 已采纳 import os for item in items: label = os.path.basename(item).split("_")[0] print(label)
python如何读取excel中的表格并画折线图？ python
2022-06-05 10:16

回答 1 已采纳这个是饼图，可以在这个基础上修改 ![img]( https://img-mid.csdnimg.cn/release/static/image/mid/ask/589357067456199.png
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

Python提取Excel特定关键字的句子并进行语调分析

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新