177资源网 2019-03-20 23:32 采纳率: 0%
浏览 2442

python怎么提取关键词

import re

listk = ['同类产品', '市场验证', '视频', '在线视频', '猫咪']
gg = "大应用平台关键字搜索同类产品,这里也许有人会说,我的想法独一无二,目前市面上还没有同类产品,那我觉得该恭喜你,如果你的产品逻辑ok,何不按照自己的思路实现出来交给市场验证。但绝大部分想法都会有同类产品已经出现,除非你是世界上少数的聪明人。"

list = []
for lste in listk:
    hh = re.findall(lste, gg, re.S)
    hh = ''.join(hh)
    if len(hh) > 0:
        list.append(hh)



我用“gjc.txt”这个文件里面的词库进行循环匹配“gg”的内容,词库词条多了就报错了

re.error: multiple repeat at position 6


我就是想提取文章中的关键词,比如:我想提取“同类产品”和“市场验证”这个两个关键词

用“jieba”好像是分词,不知道怎么才能匹配文章中指定的关键词,求大佬们指点指点


目的:用“listk”里面的属性匹配“gg”文章看看有没有,有就保存到一个列表里

  • 写回答

1条回答 默认 最新

  • notback 2019-03-21 14:42
    关注

    1 请简化你的程序,你用个txt文件,谁也无法调试你的程序
    2 你的目的是什么?你的正则表达式看不懂何意,匹配到了你要干什么?

    如果你匹配”同类产品“,r'.*?('+ lste +').*?' 直接 lste不就得了,你这么写正则何意?

    如果只是查询是否有关键字,并保存关键字
    allkey = []

    for l in ls:
        if l in gg:
                allkey.append(l)
    
    

    这不就结了?

    评论

报告相同问题?

悬赏问题

  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?