宁晓神 2021-10-27 00:14 采纳率: 0%
浏览 46

请问Python正则表达式如何在多个文本中匹配出关键字

最近小菜鸟在使用Python爬虫的过程中遇到一些问题,我想爬取一些老师的简历,并提取其中的关键字文本,如姓名、职称。
在一个简历网址中匹配出来可以,但是如果想在多个简历网址中匹配出这些关键字应该怎么做呢。我爬取到了60个网址,在这些网址中的关键字位置不一定相同,请问怎样做到批量匹配?
还请各位前辈不吝赐教。

如两种不同情况,一种是较规范的标好了关键字:姓名:黄xx
性别:男
职称:教授
专业:档案学
E-mailxxxxxx@126.com
博士生导师
还有一种不太规范,未标明关键字:
王xx,1966年生,山东沂南人。xx历史学院教授(二级岗位)、博士生导师。南开大学、临沂大学、陕西师范大学等多所高校兼职研究员、兼职教授。请问应该如何适应情况呢。

  • 写回答

2条回答 默认 最新

  • 关注

    正则表达式要根据具体文本内容的格式来写,你发下具体文本内容的格式

    评论

报告相同问题?

问题事件

  • 修改了问题 10月27日
  • 修改了问题 10月27日
  • 创建了问题 10月27日

悬赏问题

  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序