2301_77729182 2023-04-21 11:21 采纳率: 60%
浏览 28
已结题

python选取excel中的特定字符

您好,我是为了写论文所以学习了一下python的文本分析,要实现的目的就是获得excel中某一列文本数据指定关键词出现的次数,(按每一个单元格出现关键词次数来统计)但我的代码运行出来,只有关键词是一个的情况下才正确(就是keyword=‘推进’,这样一个关键词,我keyword={‘推进’,‘提升’}这样就不对了),我的关键词多几个它虽然能跑,但结果不对,请问各位我的代码哪出了问题呢?为了写论文刚开始学python 啥也不会 还请大家可以帮忙解答一下,万分感谢!!

数据示例:

img

我写的代码:

import pandas as pd
import jieba

data = pd.read_excel(r'C:\Users\86158\PycharmProjects\pythonProject3\文本分析\业绩说明会问答文本分析.xlsx')
data.head()

data1 = data.iloc[1:, :]
data1.head()
def cutword(mda):
    keywords ={'持续','发展','提升','促进'}

    wordcut = jieba.cut(mda)
    wordict = {}
    for keyword in keywords:
      for word in wordcut:
        if word in wordict.keys():
            wordict[word] += 1
        else:
            wordict[word] = 1
      if keyword in wordict.keys():
        wordcount =wordict[keyword]
      else:
        wordcount =0
    return wordcount

data1['风险词频'] = data1['Acntet'].apply(cutword)

print(data1)


  • 写回答

1条回答 默认 最新

  • GameTomato 2023-04-21 11:49
    关注

    按照以上你的代码看,也可能出现重复计数的问题,另外代码中没有考虑多关键词同时出现的情况。可以参考一下来进行修改

    ```python
    
    import pandas as pd
    import jieba
    
    def count_keyword(text, keywords):
        wordcut = jieba.cut(text)
        wordict = {}
        for word in wordcut:
            if word in wordict.keys():
                wordict[word] += 1
            else:
                wordict[word] = 1
        count = 0
        for keyword in keywords:
            if keyword in wordict.keys():
                count += wordict[keyword]
        return count
    
    data = pd.read_excel(r'C:\Users\86158\PycharmProjects\pythonProject3\文本分析\业绩说明会问答文本分析.xlsx')
    data = data.iloc[1:, :]
    
    keywords = ['持续', '发展', '提升', '促进']
    data['风险词频'] = data['Acntet'].apply(lambda x: count_keyword(x, keywords))
    
    print(data)
    

    ```

    希望能帮到你,加油~~~

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月29日
  • 已采纳回答 4月21日
  • 创建了问题 4月21日

悬赏问题

  • ¥15 unity从3D升级到urp管线,打包ab包后,材质全部变紫色
  • ¥50 comsol温度场仿真无法模拟微米级激光光斑
  • ¥15 上传图片时提交的存储类型
  • ¥15 Ubuntu开机显示器只显示kernel,是没操作系统(相关搜索:显卡驱动)
  • ¥15 VB.NET如何绘制倾斜的椭圆
  • ¥15 arbotix没有/cmd_vel话题
  • ¥15 odoo17的分包重新供应路线如何设置?可从销售订单中实时直接触发采购订单或相关单据
  • ¥15 用C语言怎么判断字符串的输入是否符合设定?
  • ¥15 通信专业本科生论文选这两个哪个方向好研究呀
  • ¥50 我在一个购物网站的排队系统排队,这个排队到号后重新定向到目标网站进行购物,但是有技术牛通过技术方法直接跳过排队系统进入目标网址购物,有没有什么软件或者脚本可以用