YCL_yuan 2019-05-28 11:46 采纳率: 0%
浏览 813

python网页爬取信息,多个正则表达式爬取,结果出现有一个空值

import requests
import re

#请求头
header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.108 Safari/537.36'}
#需要爬取的网页
url = 'http://www.114best.com/tel/'
#爬取网页信息
resp_url = requests.get(url,headers=header).content.decode().replace('\n','').replace('\t','').replace(' ','').replace('\r','')
print(resp_url)
#清洗
pat1 =r'

(.*?)[\s\S]*?|(.*?)[\s\S]*?'
pat = re.compile(pat1,re.S)
resp_pat1 =pat.findall(resp_url)

print(resp_pat1)
图片说明

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 21:39
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 spring后端vue前端
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题
  • ¥15 Visual Studio问题