YCL_yuan 2019-05-28 11:46 采纳率: 0%
浏览 813

python网页爬取信息,多个正则表达式爬取,结果出现有一个空值

import requests
import re

#请求头
header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.108 Safari/537.36'}
#需要爬取的网页
url = 'http://www.114best.com/tel/'
#爬取网页信息
resp_url = requests.get(url,headers=header).content.decode().replace('\n','').replace('\t','').replace(' ','').replace('\r','')
print(resp_url)
#清洗
pat1 =r'

(.*?)[\s\S]*?|(.*?)[\s\S]*?'
pat = re.compile(pat1,re.S)
resp_pat1 =pat.findall(resp_url)

print(resp_pat1)
图片说明

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 21:39
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥50 如何增强飞上天的树莓派的热点信号强度,以使得笔记本可以在地面实现远程桌面连接
  • ¥15 MCNP里如何定义多个源?
  • ¥20 双层网络上信息-疾病传播
  • ¥50 paddlepaddle pinn
  • ¥20 idea运行测试代码报错问题
  • ¥15 网络监控:网络故障告警通知
  • ¥15 django项目运行报编码错误
  • ¥15 请问这个是什么意思?
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services