请问如果我想用正则表达式提取文本中像这样:
科技部发布国家重点研发计划“农业生物重要性状形成与环境适应性基础研究”等重点专项2022年度项目申报指南
两个p中间的文字应该怎么写
我用的表达式是:
def get_title(txt):
Lst = re.findall(txt,'(?<=
)[\u4E00-\u9FA5]*?(?=
)')return Lst
但是系统报错error: multiple repeat
这是为什么呢 有什么解决方法吗
请问如果我想用正则表达式提取文本中像这样:
科技部发布国家重点研发计划“农业生物重要性状形成与环境适应性基础研究”等重点专项2022年度项目申报指南
)[\u4E00-\u9FA5]*?(?=
)')import re
s = "科技部发布国家重点研发计划<p>农业生物重要性状形成与环境适应性基础研究</p>等重点专项2022年度项目申报指南"
res =re.findall('(?<=<p>)[\u4E00-\u9FA5]*?(?=</p>)', s)
print(res)