2301_77729182 2023-04-21 21:54 采纳率: 60%
浏览 31
已结题

Python提取Excel中特定关键字并进行语调分析

您好,我是为了写论文要利用Python进行一个文本分析的处理。但本人之前从未接触过Python,学了一段时间后发现要实现功能还是很困难,所以前来寻求大家的帮助。我的数据是公司回答投资者问题的文本数据。就会出现一家公司一年内有好几行回答问题的文本。我要实现的功能是将回答内容那一列的文本,按照公司和年份进行合并(也就是把一家公司一年所有回答内容合并到一个单元格中)然后将中带有一些特定关键字的句子都筛选出来,并进行语调积极程度的分析,最终想要得到的是该公司在该年语调积极程度评分。请问这个用Python代码怎么实现呢?因为没有Python基础,所以自己在编写代码上有困难,希望可以得到大家的帮助,谢谢!
我的原始数据长这样:

img


我想把数据整合成类似于这样:

img


我最终想要得到的数据类似于长这样:

img

  • 写回答

2条回答 默认 最新

  • threenewbee 2023-04-21 23:04
    关注

    就是按照前两列合并?这个我帮你写了一个

    import pandas as pd
    from openpyxl import Workbook, load_workbook
    from openpyxl.utils import get_column_letter
    
    # 读取Excel文件
    filename = 'data.xlsx'
    df = pd.read_excel(filename, sheet_name='Sheet1')
    
    # 根据股票代码和会计年度进行分组并连接内容
    grouped = df.groupby(['股票代码', '会计年度'], sort=False)['内容'].apply(''.join).reset_index()
    
    # 创建新的Excel文件并写入数据
    new_filename = 'merged_data.xlsx'
    sheet_name = 'Sheet2'
    book = Workbook()
    writer = pd.ExcelWriter(new_filename, engine='openpyxl') 
    writer.book = book
    grouped.to_excel(writer, sheet_name=sheet_name, index=False)
    writer.save()
    
    # 调整列宽以适应数据
    wb = load_workbook(new_filename)
    ws = wb[sheet_name]
    for column in ws.columns:
        max_length = 0
        column = column[0].column_letter
        for cell in ws[column]:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(str(cell.value))
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        ws.column_dimensions[column].width = adjusted_width
    wb.save(new_filename)
    
    

    至于语调分析,这个你可以找找相关的库去计算

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月30日
  • 已采纳回答 4月22日
  • 创建了问题 4月21日

悬赏问题

  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测