2301_77729182 2023-04-21 21:54 采纳率: 60%
浏览 31
已结题

Python提取Excel中特定关键字并进行语调分析

您好,我是为了写论文要利用Python进行一个文本分析的处理。但本人之前从未接触过Python,学了一段时间后发现要实现功能还是很困难,所以前来寻求大家的帮助。我的数据是公司回答投资者问题的文本数据。就会出现一家公司一年内有好几行回答问题的文本。我要实现的功能是将回答内容那一列的文本,按照公司和年份进行合并(也就是把一家公司一年所有回答内容合并到一个单元格中)然后将中带有一些特定关键字的句子都筛选出来,并进行语调积极程度的分析,最终想要得到的是该公司在该年语调积极程度评分。请问这个用Python代码怎么实现呢?因为没有Python基础,所以自己在编写代码上有困难,希望可以得到大家的帮助,谢谢!
我的原始数据长这样:

img


我想把数据整合成类似于这样:

img


我最终想要得到的数据类似于长这样:

img

  • 写回答

2条回答 默认 最新

  • threenewbee 2023-04-21 23:04
    关注

    就是按照前两列合并?这个我帮你写了一个

    import pandas as pd
    from openpyxl import Workbook, load_workbook
    from openpyxl.utils import get_column_letter
    
    # 读取Excel文件
    filename = 'data.xlsx'
    df = pd.read_excel(filename, sheet_name='Sheet1')
    
    # 根据股票代码和会计年度进行分组并连接内容
    grouped = df.groupby(['股票代码', '会计年度'], sort=False)['内容'].apply(''.join).reset_index()
    
    # 创建新的Excel文件并写入数据
    new_filename = 'merged_data.xlsx'
    sheet_name = 'Sheet2'
    book = Workbook()
    writer = pd.ExcelWriter(new_filename, engine='openpyxl') 
    writer.book = book
    grouped.to_excel(writer, sheet_name=sheet_name, index=False)
    writer.save()
    
    # 调整列宽以适应数据
    wb = load_workbook(new_filename)
    ws = wb[sheet_name]
    for column in ws.columns:
        max_length = 0
        column = column[0].column_letter
        for cell in ws[column]:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(str(cell.value))
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        ws.column_dimensions[column].width = adjusted_width
    wb.save(new_filename)
    
    

    至于语调分析,这个你可以找找相关的库去计算

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月30日
  • 已采纳回答 4月22日
  • 创建了问题 4月21日

悬赏问题

  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助
  • ¥15 STM32控制MAX7219问题求解答