Y030626 2022-05-04 23:21 采纳率: 78.9%
浏览 50
已结题

re.findall(txt,'(?<=<p>)[\u4E00-\u9FA5]*?(?=</p>)')为什么会报错

请问如果我想用正则表达式提取文本中像这样:

科技部发布国家重点研发计划“农业生物重要性状形成与环境适应性基础研究”等重点专项2022年度项目申报指南


两个p中间的文字应该怎么写
我用的表达式是:
def get_title(txt):
Lst = re.findall(txt,'(?<=

)[\u4E00-\u9FA5]*?(?=

)')
return Lst
但是系统报错error: multiple repeat
这是为什么呢 有什么解决方法吗

  • 写回答

2条回答 默认 最新

  • chuifengde 2022-05-05 07:48
    关注
    import re
    
    s =  "科技部发布国家重点研发计划<p>农业生物重要性状形成与环境适应性基础研究</p>等重点专项2022年度项目申报指南"
    res =re.findall('(?<=<p>)[\u4E00-\u9FA5]*?(?=</p>)', s)
    print(res)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月13日
  • 已采纳回答 5月5日
  • 创建了问题 5月4日

悬赏问题

  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 软件测试决策法疑问求解答
  • ¥15 win11 23H2删除推荐的项目,支持注册表等
  • ¥15 matlab 用yalmip搭建模型,cplex求解,线性化处理的方法
  • ¥15 qt6.6.3 基于百度云的语音识别 不会改
  • ¥15 关于#目标检测#的问题:大概就是类似后台自动检测某下架商品的库存,在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
  • ¥15 神经网络怎么把隐含层变量融合到损失函数中?
  • ¥15 lingo18勾选global solver求解使用的算法
  • ¥15 全部备份安卓app数据包括密码,可以复制到另一手机上运行
  • ¥20 测距传感器数据手册i2c