问题遇到的现象和发生背景
在网页源代码中寻找有用的信息,但复制下来的源代码是作为一个字符串复制下来的,在使用re.findall()只能提取最后一个符合标准的数据。
问题相关代码,请勿粘贴截图
txt文件中储存下面这一串字符串
a1234bretyuiyterertytuy11516ewttytuyr221215412yrttuy5tu1yra5678bewrtyuttretytutuy1595115152
比如在该字符串中同时提取处于 a 和 b 中间的数据 ’1234‘ 和 ’5678‘
我是用
import re
import xlsxwriter
txt = "ce.txt"
with open(txt, 'r', encoding='utf-8') as f:
content = f.read() # 读取txt文件内容 保存到content中
result = re.findall(".a(.)b.*", content)
result
运行结果及报错内容
运行结果只返回最后一个匹配的数据['5678']