177资源网 2019-03-20 23:32 采纳率: 0%
浏览 2442

python怎么提取关键词

import re

listk = ['同类产品', '市场验证', '视频', '在线视频', '猫咪']
gg = "大应用平台关键字搜索同类产品,这里也许有人会说,我的想法独一无二,目前市面上还没有同类产品,那我觉得该恭喜你,如果你的产品逻辑ok,何不按照自己的思路实现出来交给市场验证。但绝大部分想法都会有同类产品已经出现,除非你是世界上少数的聪明人。"

list = []
for lste in listk:
    hh = re.findall(lste, gg, re.S)
    hh = ''.join(hh)
    if len(hh) > 0:
        list.append(hh)



我用“gjc.txt”这个文件里面的词库进行循环匹配“gg”的内容,词库词条多了就报错了

re.error: multiple repeat at position 6


我就是想提取文章中的关键词,比如:我想提取“同类产品”和“市场验证”这个两个关键词

用“jieba”好像是分词,不知道怎么才能匹配文章中指定的关键词,求大佬们指点指点


目的:用“listk”里面的属性匹配“gg”文章看看有没有,有就保存到一个列表里

  • 写回答

1条回答 默认 最新

  • notback 2019-03-21 14:42
    关注

    1 请简化你的程序,你用个txt文件,谁也无法调试你的程序
    2 你的目的是什么?你的正则表达式看不懂何意,匹配到了你要干什么?

    如果你匹配”同类产品“,r'.*?('+ lste +').*?' 直接 lste不就得了,你这么写正则何意?

    如果只是查询是否有关键字,并保存关键字
    allkey = []

    for l in ls:
        if l in gg:
                allkey.append(l)
    
    

    这不就结了?

    评论

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog