啥也学不到 2021-01-20 17:27 采纳率: 0%
浏览 73

正则替换<br />为回车?

a=requests.get('https://www.23us.com/html/78/78926/').content.decode('gbk')#decode('gbk')为编码方式
b='<a href="(\d+\.html)">.*?</a>'
c=re.compile(b)
d=c.findall(a)
for i in d[0:1]:
    hrefs='https://www.23us.com/html/78/78926/'+i
    a=requests.get(hrefs).content.decode('gbk')
    b='<h1>(.*?)</h1>.*?<dd id="contents".*?>(.*?)</dd>'
    b=b.replace('/<br \/>', "\r")
    c=re.compile(b,re.S)
    d=c.findall(a)
    print(d)
  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-07 17:20
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题
  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突