Yesmit 2021-05-18 21:23 采纳率: 100%
浏览 398
已采纳

正则匹配式如何取出固定字符后的中文文本?

如上图所示,想取出公司名称和联系地址,试了很多次都取不出来,应该是正则匹配有误,跪求大佬TAT指导

mc = re.compile(u"公司名称:.*?([\u4E00-\u9FA5])",re.DOTALL)
if mc.search(content):
   company = str(mc.search(content))
else:
   print(path + '\t' + 'not exist' + '\t' + 'company')
  • 写回答

1条回答 默认 最新

  • benbenli 2021-05-18 21:35
    关注
    import re
    
    content = "公司名称:宇宙牛皮无限责任公司"
    mc = re.compile(u"公司名称(:|:)(.*)",re.DOTALL)
    if mc.search(content):
       company = mc.search(content).group(2)
       print(f"找到了公司:{company}")
    else:
       print(f"文本里没找打公司:{content}")
    
    // Output:
    找到了公司:宇宙牛皮无限责任公司
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示
  • ¥15 arduino 步进电机
  • ¥20 程序进入HardFault_Handler
  • ¥15 关于#python#的问题:自动化测试