python怎么提取关键词

import re

listk = ['同类产品', '市场验证', '视频', '在线视频', '猫咪']
gg = "大应用平台关键字搜索同类产品，这里也许有人会说，我的想法独一无二，目前市面上还没有同类产品，那我觉得该恭喜你，如果你的产品逻辑ok，何不按照自己的思路实现出来交给市场验证。但绝大部分想法都会有同类产品已经出现，除非你是世界上少数的聪明人。"

list = []
for lste in listk:
    hh = re.findall(lste, gg, re.S)
    hh = ''.join(hh)
    if len(hh) > 0:
        list.append(hh)

我用“gjc.txt”这个文件里面的词库进行循环匹配“gg”的内容，词库词条多了就报错了

re.error: multiple repeat at position 6

我就是想提取文章中的关键词，比如：我想提取“同类产品”和“市场验证”这个两个关键词

用“jieba”好像是分词，不知道怎么才能匹配文章中指定的关键词，求大佬们指点指点

目的：用“listk”里面的属性匹配“gg”文章看看有没有，有就保存到一个列表里

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
notback 2019-03-21 14:42
关注
1 请简化你的程序，你用个txt文件，谁也无法调试你的程序
2 你的目的是什么？你的正则表达式看不懂何意，匹配到了你要干什么？

如果你匹配”同类产品“，r'.*?('+ lste +').*?' 直接 lste不就得了，你这么写正则何意？

如果只是查询是否有关键字，并保存关键字
allkey = []

for l in ls: if l in gg: allkey.append(l)

这不就结了？
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 代码目的:根据关键词提取前后行内容 python
2021-12-07 20:01

回答 2 已采纳【有帮助请采纳】 inputfile = input('输入文件路径：')#此处输入绝对路径 inlist = [] with open(inputfile,'r') as file: fil
python正则表达式如何利用关键词提高提取个人信息的精准度 python 有问必答
2021-04-12 19:35

回答 3 已采纳用python提取电脑中html文件是： with open("xxx.html","r",encoding="utf-8") as fileObj: data = fileObj.rea
python 匹配excel和txt文件，提取含有关键词的行 python
2020-02-25 14:39

回答 2 已采纳 ``` def get_key_list(txt_file): try: file_data = open(txt_file, 'r') list
python实现关键词提取的示例讲解
2020-09-20 13:23

下面小编就为大家分享一篇python实现关键词提取的示例讲解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
文本预处理，关键词提取时时报错 python 有问必答
2021-08-30 11:22

回答 3 已采纳 word, freq = line.strip().split(' ')这里报错是因为:一行字符串在分割后多于两个子字符串，所以报错。检查一下line的值，找出word和freq对应的索引，使用lin
python处理超大（12.3GB）CSV文件，获取指定关键词所在行的数据输出为新CSV文件 python 有问必答
2023-01-14 17:07

回答 3 已采纳你可以先测试一下，用pandas,如果数据太大，你还可以先切一部分数据出来看看 import pandas as pd dd=pd.read_csv('大文件.csv') #数据切片 df=dd[0:
提取关键词，加载停用词表时好时坏，总是报错 python 算法
2022-11-08 11:49

回答 1 已采纳这个要变成 len(corpus) - 1 哦，比如 corpus 长度为 7 ，而 randint 可能会取到 7 .数组的索引是 (0) 到 (len-1)。取到 len 的话这个就超出了数组
python提取内容关键词的方法
2020-12-24 08:14

本文实例讲述了python提取内容关键词的方法。分享给大家供大家参考。具体分析如下：一个非常高效的提取内容关键词的python代码，这段代码只能用于英文文章内容，中文因为要分词，这段代码就无能为力了，不过要加上...
用python批量提取txt文件中的目标数字和关键单词，目标数字和关键词在txt中有相同的属性：，且都在同一行。 python 有问必答
2023-01-11 21:20

回答 3 已采纳正则提取下 import os from openpyxl import Workbook import re wb=Workbook() sheet=wb.worksheets[0] sheet.
为什么使用Python读取JSON文件时，搜索指定关键字Python会报KeyError的错，但JSON文件中确实有对应的关键词？ json python 有问必答
2022-01-07 13:07

回答 1 已采纳读取成字典后这样取值： dic={ "type": "FeatureCollection", "features": [ { "type": "
Python re.findall怎么模糊多个词语然后匹配后获取到句子中的内容 python
2021-03-23 00:02

回答 4 已采纳 import re text = ''' <td class="abcde:0:WW_11" style=";"><center>占位这是关键
Python提取关键词
2022-02-16 15:16

MetaTrade的博客 #!/usr/bin/env python ...# @File : 提取关键词.py # @Software: PyCharm+ # 提取关键词 import pandas as pd import jieba.posseg as pseg from datetime import datetime path=r'F:/' file='xx..
python 运行这段代码进入循环后退出 python 有问必答
2022-03-12 10:37

回答 3 已采纳你的意思是函数执行后没有打印输出还是?TranslateFile函数需要读取.\dst_dir目录下的文件读取,读取的PDF类文件,你的目录下放置文件了吗,还是路径不对
python提取关键词前后原文_python提取文本关键词
2020-12-19 11:11

weixin_39938331的博客 python提取关键词textrank算法，将数据库中的数据提取出来，然后进行分析，代码如下import pymysqlimport jiebafrom textrank4zh import TextRank4Keyword,TextRank4Sentenceimport loggingjieba.setLogLevel...
python多进程提取处理大量文本的关键词方法
2020-09-20 10:14

今天小编就为大家分享一篇python多进程提取处理大量文本的关键词方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

python怎么提取关键词

目的：用“listk”里面的属性匹配“gg”文章看看有没有，有就保存到一个列表里

1条回答 默认 最新

悬赏问题

1条回答默认最新