python怎么提取关键词

import re

listk = ['同类产品', '市场验证', '视频', '在线视频', '猫咪']
gg = "大应用平台关键字搜索同类产品，这里也许有人会说，我的想法独一无二，目前市面上还没有同类产品，那我觉得该恭喜你，如果你的产品逻辑ok，何不按照自己的思路实现出来交给市场验证。但绝大部分想法都会有同类产品已经出现，除非你是世界上少数的聪明人。"

list = []
for lste in listk:
    hh = re.findall(lste, gg, re.S)
    hh = ''.join(hh)
    if len(hh) > 0:
        list.append(hh)

我用“gjc.txt”这个文件里面的词库进行循环匹配“gg”的内容，词库词条多了就报错了

re.error: multiple repeat at position 6

我就是想提取文章中的关键词，比如：我想提取“同类产品”和“市场验证”这个两个关键词

用“jieba”好像是分词，不知道怎么才能匹配文章中指定的关键词，求大佬们指点指点

目的：用“listk”里面的属性匹配“gg”文章看看有没有，有就保存到一个列表里

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
notback 2019-03-21 14:42
关注
1 请简化你的程序，你用个txt文件，谁也无法调试你的程序
2 你的目的是什么？你的正则表达式看不懂何意，匹配到了你要干什么？

如果你匹配”同类产品“，r'.*?('+ lste +').*?' 直接 lste不就得了，你这么写正则何意？

如果只是查询是否有关键字，并保存关键字
allkey = []

for l in ls: if l in gg: allkey.append(l)

这不就结了？
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python实现关键词提取的示例讲解
2020-09-20 13:23

在代码中，`jieba.analyse.extract_tags()` 函数用于提取关键词，可以设置参数 `topK` 控制返回的关键词数量，`withWeight` 控制是否返回关键词的权重值，`allowPOS` 用于筛选特定词性的词。运行示例代码后，得到...
python提取内容关键词的方法
2020-09-22 08:53

对于中文，可以使用jieba或THULAC等分词库，再结合NLTK或其他方法提取关键词。总的来说，Python通过NLTK库提供了一种高效的方法来提取英文内容的关键词。这种方法结合了正则表达式、词性标注、n-gram模型和半共现...
Python提取关键词
2022-02-16 15:16

流动熵的博客 #!/usr/bin/env python ...# @File : 提取关键词.py # @Software: PyCharm+ # 提取关键词 import pandas as pd import jieba.posseg as pseg from datetime import datetime path=r'F:/' file='xx..
python中怎么提取关键词
2024-12-22 18:25

hakesashou的博客 = "，") : final = final + " " + word print(final) #第三步：提取关键词 a=jieba.analyse.extract_tags(text, topK = 5, withWeight = True, allowPOS = ()) b=jieba.analyse.extract_tags(text...
基于python 实现语义的关键词提取
2024-09-17 20:19

【作品名称】：基于python 实现语义的关键词提取【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】：程序的调用：在...
python多进程提取处理大量文本的关键词方法
2020-09-20 10:14

jieba库中的analyse模块可以用来提取关键词，而set_stop_words函数用于设置停用词，即告诉分词系统哪些词是不希望被提取为关键词的。文章中给出的代码示例中，定义了一个名为extract_keyword的函数，该函数接收一...
python提取关键词前后原文_python提取文本关键词
2020-12-19 11:11

weixin_39938331的博客 python提取关键词textrank算法，将数据库中的数据提取出来，然后进行分析，代码如下import pymysqlimport jiebafrom textrank4zh import TextRank4Keyword,TextRank4Sentenceimport loggingjieba.setLogLevel...
python提取关键词前后原文_python实现关键词提取的示例讲解
2021-02-10 14:05

弓弢的博客 _今天我来弄一个简单的关键词提取的代码文章内容关键词的提取分为三大步：(1) 分词(2) 去停用词(3) 关键词提取分词方法有很多，我这里就选择常用的结巴jieba分词；去停用词，我用了一个停用词表。具体代码如下：...
基于python文本关键词主题提取完整数据代码可直接运行
2023-03-09 21:08

每份代码可能包括读取文本数据、预处理（如去除停用词和标点符号）、构建模型和提取关键词的步骤。运行这些文件，你可以对比不同方法在关键词提取和主题发现上的效果。通过理解并实践这些Python代码，你将能够掌握...
python提取关键词分类_用Py做文本分析5：关键词提取
2020-12-30 02:36

weixin_39929566的博客 1.关键词提取关键词指的是原始文档的和核心信息，关键词提取在文本聚类、分类、自动摘要等领域中有着重要的作用。针对一篇语段，在不加人工干预的情况下提取出其关键词首先进行分词处理关键词分配：事先给定关键词库...
没有解决我的问题, 去提问

python怎么提取关键词

目的：用“listk”里面的属性匹配“gg”文章看看有没有，有就保存到一个列表里

1条回答 默认 最新

1条回答默认最新