python 匹配excel和txt文件，取得txt文件中词语出现的频率

目前情况是这样的，有一个excel文件存放文档，用txt文件存放关键词
然后将txt文件和excel进行匹配看txt文件里的关键词出现的次数
txt文件的关键词是以

成都
北京
天津
上海
香港

这样的形式存放的
我想

def frequency(list_word):
    c = Counter()
    for x in list_word:
        if len(x) > 1 and x != '\r\n':
            c[x] += 1
    word = []
    key = []
    for (k, v) in c.most_common(100):
        print('%s  %d' % (k, v))
        word.append(k)
        key.append(v)
    return key,word
def high_frequency():
    list_keyword = []
    for mes in result:
                content = result
        for keyword in data_keyword[0]:
              res = content.count(keyword)
              for i in range(res):
                  list_keyword.append(keyword)

通过这样方式来，但是无法匹配，求更快的方法

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

陈年椰子 2020-03-12 13:01

关注

用字典记录关键字出现的次数


# 读关键字
def get_key_list(txt_file):
    try:
        file_data = open(txt_file, 'r', encoding='utf8')
        list1 = file_data.readlines()
        key_list = [k.strip('\n') for k in list1]
        return key_list
    except:
        pass
    return []

# 按关键字列表遍历EXCEL ， 写入统计表
def xls_select_proc(xls_sr, xls_tg, key_list):
    from openpyxl import Workbook
    from openpyxl import load_workbook
    # 只处理第一个工作表 , 待匹配数据在第一列
    wb = load_workbook(xls_sr)
    ws = wb[wb.sheetnames[0]]

    wb_tg = Workbook()
    sheet_tg = wb_tg.active
    sheet_tg.title = "关键词统计"
    save_i = 0
    sr_i = 0

    # 表格头
    sheet_tg[chr(ord('A') + 0) + '%d' % (save_i + 1)] = '关键词'
    sheet_tg[chr(ord('A') + 1) + '%d' % (save_i + 1)] = '出现次数'
    save_i = save_i + 1

    # 关键词统计字典
    key_dict = {}

    for row in ws.rows:
        sr_i = sr_i + 1
        if row[0] is None:
            break

        for k in key_list:
            key_sum = str(row[0].value).count(k[1])

            if key_sum > 0:
                if k[1] in key_dict:
                    key_cnt = key_dict[k[1]]
                    key_dict[k[1]] = key_cnt + key_sum
                else:
                    key_dict[k[1]] = key_sum
    # 写入Excel
    for k in key_dict:
        sheet_tg[chr(ord('A') + 0) + '%d' % (save_i + 1)] = k
        sheet_tg[chr(ord('A') + 1) + '%d' % (save_i + 1)] = key_dict[k]
        save_i = save_i + 1
        # print(k,key_dict[k])
    # 保存文件
    wb_tg.save(xls_tg)
    wb.close()
    wb_tg.close()

def xls_select3(xls_sr, xls_tg, key_file_data):
    tg_file = "{}.xlsx".format(xls_tg)
    key_list = []
    for kf in key_file_data:
        for k in kf[1]:
            key_list.append([kf[0][:-4],k])
    xls_select_proc(xls_sr, tg_file, key_list)

key_file = ['关键词.txt']
key_file_data = []
print('开始处理')
try:
    for kf in key_file:
        key_file_data.append([kf, get_key_list(kf)])
    xls_select3('文本.xlsx', '结果', key_file_data)
except Exception as e:
    print('处理出错：\n',repr(e))

print('处理完成')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python处理excel文件并获取符合条件的关键值出现的次数
2021-09-09 22:11

吃饱了事没饭先森的博客 Python 统计excel文件欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改变 ...
【Python文本分析】-通用版词频分析工具，输入目录和关键词，自动统计文件夹内所有txt文本词频并存入表格中
2024-12-09 15:23

词频分析是一种基本的文本挖掘技术，它涉及到从大量文本数据中识别和计算词语出现的频率。本文介绍的是一种通用版的Python文本分析工具，其主要功能是对指定目录下的所有txt文本文件进行词频统计，并将统计结果以...
python 导入excel 分词_如何对excel表格里的词结巴分词python
2020-12-03 03:00

weixin_39625468的博客我们知道，汉语中各个字单独作词语的能力是不同的，此外有的字常常作为前缀出现，有的字却常常作为后缀（“者”“性”），结合两个字相临时是否成词的信息，这样就得到了许多与分词有关的知识。这种方法就是充分...
哔哩哔哩IT私塾python爬虫视频教程中的项目文件
2025-02-27 14:03

草海桐的博客第一个项目douban（纯python项目）：爬取数据并保存到xls和数据库。第二个项目douban_flask（flask项目）：把第一个项目得到的数据库文件的数据可视化。
python 可以用excel做词云图嘛_今天从零教你开始利用Python打造词云图！
2021-02-09 09:57

姚脑师的博客 1. 量身打造属于你的词云图今天的Python案例是跟着笔者来打造属于自己的词云图。那么什么是词云图呢？我们在百度中来搜索一下，如图所示：概念：词云图就是由词汇组成类似云的彩色图形。接下来我们就可以去为自己量...
python英文字符频率统计_Python中怎样统计英文文本中的字母频次？
2020-11-20 19:32

weixin_39734458的博客有时我们关注个别字母和汉字的出现频率，也有时候我们更多会关注个别单词或词语的出现频率。针对这两种常见的频次统计需求，还是先不要考虑如何用python实现的问题。python能帮我们完成很多事，但它永远无法帮我们...
不用Python，从Excel开始：Transformer架构详解与实战（小白必藏）
2025-10-04 14:51

大模型玩家的博客 01. 没有Python，从Excel开始… 作为一个零基础想要跨领域了解AI的人，学习Transformer就跟拿起单词本开始背“abandon”一样，是一个必要的开机操作。但是《Attention is all you need》作为一篇极其简练精巧的学术...
问答系列python——如何用字典的基础知识统计一段英语短文中每个单词出现的次数？
2024-12-10 20:30

资源补给站的博客要使用字典的基础知识来统计一段英语短文中每个单词出现的次数，可以按照以下步骤进行：获取用户输入：使用input()函数获取用户输入的英文句子。转换为小写：使用lower()方法将句子转换为小写，以确保统计时不区分大...
用Python分析文本数据的词频并词云图可视化
2023-09-20 09:48

艾派森的博客可视化能力：Python中的库，如Matplotlib、Seaborn和Plotly，可以用于生成各种数据可视化，帮助用户更好地理解和展示文本数据的分析结果。机器学习和深度学习支持：Python在机器学习和深度学习方面表现出色，因此...
文本分析-使用Python做词频统计分析
2023-06-23 08:35

艾派森的博客前面我们已经介绍了文本分析中的中文分词和去除停用词，这篇文章将详细介绍分词后如何进行词频统计分析。
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

python 匹配excel和txt文件，取得txt文件中词语出现的频率

2条回答默认最新

码龄粉丝数原力等级 --

python 匹配excel和txt文件，取得txt文件中词语出现的频率

2条回答 默认 最新

2条回答默认最新