Yesmit 2021-05-18 21:23 采纳率: 100%
浏览 399
已采纳

正则匹配式如何取出固定字符后的中文文本?

如上图所示,想取出公司名称和联系地址,试了很多次都取不出来,应该是正则匹配有误,跪求大佬TAT指导

mc = re.compile(u"公司名称:.*?([\u4E00-\u9FA5])",re.DOTALL)
if mc.search(content):
   company = str(mc.search(content))
else:
   print(path + '\t' + 'not exist' + '\t' + 'company')
  • 写回答

1条回答 默认 最新

  • benbenli 2021-05-18 21:35
    关注
    import re
    
    content = "公司名称:宇宙牛皮无限责任公司"
    mc = re.compile(u"公司名称(:|:)(.*)",re.DOTALL)
    if mc.search(content):
       company = mc.search(content).group(2)
       print(f"找到了公司:{company}")
    else:
       print(f"文本里没找打公司:{content}")
    
    // Output:
    找到了公司:宇宙牛皮无限责任公司
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 急matlab编程仿真二阶震荡系统
  • ¥20 TEC-9的数据通路实验
  • ¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
  • ¥50 MATLAB实现圆柱体容器内球形颗粒堆积
  • ¥15 python如何将动态的多个子列表,拼接后进行集合的交集
  • ¥20 vitis-ai量化基于pytorch框架下的yolov5模型
  • ¥15 如何实现H5在QQ平台上的二次分享卡片效果?
  • ¥15 python爬取bilibili校园招聘网站
  • ¥30 求解达问题(有红包)
  • ¥15 请解包一个pak文件