a=requests.get('https://www.23us.com/html/78/78926/').content.decode('gbk')#decode('gbk')为编码方式
b='<a href="(\d+\.html)">.*?</a>'
c=re.compile(b)
d=c.findall(a)
for i in d[0:1]:
hrefs='https://www.23us.com/html/78/78926/'+i
a=requests.get(hrefs).content.decode('gbk')
b='<h1>(.*?)</h1>.*?<dd id="contents".*?>(.*?)</dd>'
b=b.replace('/<br \/>', "\r")
c=re.compile(b,re.S)
d=c.findall(a)
print(d)
正则替换<br />为回车?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-