import re
data = 'Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI Article 95广告·www.gotdya.net/为什么会显示该广告?'
print(data)
print(re.match('.*',data))
data里的文本是从谷歌搜索结果页面里面截取的
运行结果是:
Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI Article 95广告·www.gotdya.net/为什么会显示该广告? <re.Match object; span=(0, 88), match='Hand Sanitizer Supplier-GOTDYA - with FDA CE BSCI>
文本的后半部分没有被match出来
如果正则匹配“Article 95广告·www.gotdya.net/为什么会显示该广告?”这段文字中的任何字段,也会返回None
如何才能提取出后半段文字呢?