import re
text = 'Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI Article 95广告·www.gotdya.net/为什么会显示该广告?'
print(re.match('.*',text))
text的文本来自谷歌搜索的html代码,运行结果是
<re.Match object; span=(0, 88), match='Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI>
后面的部分没有显示出来。如果正则没有显示出来的字符,比如“广告”,就会返回none
有个大佬说用
print(re.match('.*',text).group())
运行结果是
Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI Article 95广告·www.gotdya.net/为什么会显示该广告?
的确显示出了文本的后半部分
不过我的目标是把“Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI”和“www.gotdya.net”这两段文本放到两个新的列表里面,
如果使用
print(re.match('www.gotdya.net',text))
返回的是none
如果使用
print(re.match('www.gotdya.net',text).group())
会报错
AttributeError: 'NoneType' object has no attribute 'group'
这是什么疑难杂症
为什么不能运行呢.jpg