import re
s = 'r<li title=" 天玑1100">CPU型号: 天玑1100</li>'
a = '<li title="2021011606369214">证书编号:2021011606369214</li>'
v = re.findall(r'<li title=".+">(.+)</li>',s)
print(v)
我使写的这个办法,两个全部都可以匹配出来,能不能实现精准定位,就匹配其中一个,另外的无法匹配。
['CPU型号:\xa0天玑1100']
最后匹配一个标签的时候还出现了这个问题,怎么能将\xa0给去掉