爬虫报错，headers也加了为啥还报错呀？

前面infos的find＿all没有报错，print（infos）可以成功，但到下面爬具体内容的时候就显示AttributeError: 'NoneType' object has no attribute 'find_all'，请问该怎么解决呀

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Syb呀呀 2021-11-19 14:06

关注

观察了一下此网站，是他的地理位置那一栏的标签顺序有变化，所以find未找到对应的值，导致解析失败无数据，建议换一种解析库，代码如下：

import time
import requests
from lxml import etree
headers={'User-Agent':'',
         'Referer':'https://dl.58.com/zufang/pg2/'} # headers参数自己补充一下，通过测试，只需要Referer和请求头即可
for u in range(1,4):
    url='https://dl.58.com/zufang/pg2/pn'+str(u)+'/'
    print(url)
    res=requests.get(url,headers=headers,proxies=test_IP.proxies)
    dom=etree.HTML(res.text)
    title=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/h2/a/text()")
    area=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p[@class='room']/text()")
    position_1=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p/a[1]/text()")
    position_2=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p/a[2]/text()")
    price=dom.xpath("//div[@class='money']/b/text()")
    for i in range(len(title)):
        print('标题为:',title[i].strip())
        print('面积为:',area[i].strip().replace(' ',''))
        print('位置为:',position_1[i]+'\t'+position_2[i])
        print('价格为:',str(price[i])+'元/每月')
        print('----------分割线----------')
    time.sleep(2)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python爬虫不报错也不出结果？
2024-05-28 22:57

m0_45207459的博客刚学爬虫对着视频想爬个网络小说但是代码写完不报错也不出结果，大佬们帮忙看看啥情况。# 从元组中取出部分链接进行拼接，获取每章的页面链接。# XPATH筛选出文本数据，并将数据列表转换成字符串。print("正在下载" ...
python 爬虫报错求救
2020-12-22 02:37

raise JSONDecodeError(“Expecting value”, s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)报错! 在找到某度文库文档的js文件链接后想用json.loads()进行解析...
python爬虫常见报错_python爬虫入门常见错误集合
2020-11-28 12:43

weixin_39911998的博客在入门爬虫的时候遇到不少问题，和不是唯一的解决方法的方法，总结整理一下，供大家学习交流。syntaxerror: invalid syntax语法错误：无效语法syntaxerror: unexpected EOF while parsing语法错误：多了无法解析的...
Python中爬虫反爬机制报错的排查与修复
2025-05-04 19:20

喜欢编程就关注我的博客 Python爬虫反爬调试需要结合请求伪装行为模拟和数据解析开发阶段使用curl -I命令验证请求头配置通过Fiddler抓包分析动态参数生成逻辑借助PyCharm调试器逐步执行JS逆向代码测试阶段编写单元测试验证代理池可用性使用...
Python 爬虫代码不报错，也不显示爬取内容，求解
2021-12-26 19:31

cortanaji的博客 data=self.formdata,headers= self.headers) return response.content def run(self): #url #header #formdata self.generate_formdata() print(self.formdata) #发送请求，获取相应 data = self.get_data() print...
python爬虫常见报错_python爬虫：常见HTTPError异常
2020-11-28 12:43

weixin_39849671的博客我们学习Python的过程中总是遇到很多难题，最常见的比如IP限制，我们学会通过使用代理IP来解决，其他情况下也会存在很多异常或者麻烦，需要大家耐心学习，今天就讲解下常见的HTTPError异常。100：继续客户端应当...
已解决Python爬虫报错＜response [406]＞
2023-02-05 21:43

小满大王i的博客已解决Python爬虫报错[406]＞
python爬虫资源路径报错_python爬虫
2020-12-09 08:18

weixin_39904587的博客一、网络爬虫介绍网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。例如，百度、google搜索某关键字时，就是爬取整个互联网上的相关资源，给呈现出来。实际爬虫四个步骤：...
python爬虫常见报错_Python爬虫总结——常见的报错、问题及解决方案
2020-11-28 12:43

weixin_39654245的博客在爬虫开发时，我们时常会遇到各种BUG各种问题，下面是我初步汇总的一些报错和解决方案。在以后的学习中，如果遇到其他问题，我也会在这里进行更新。各位如有什么补充，欢迎评论区留言~~~问题：IP被封，或者因访问...
已解决Python爬虫报错＜Response [403]＞
2022-11-11 21:13

小满大王i的博客已解决Python爬虫报错[403]＞
[python爬虫报错]‘errno‘: 1022
2024-10-12 08:40

hapstu_ss的博客 {‘errno’: 1022, ‘errmsg’: ‘访问出现异常，请刷新后重试！...推测是触发了网页的反爬机制，在requests.post()中加上了headers之后还是报错，再添加了。（据说类似headers，骗过反爬机制）成功爬取数据。
python爬虫运行正常最后报错_Python爬虫运行正常，最后却报错
2021-03-06 17:10

莫加洛夫的博客问题： Python爬虫运行正常，最后却报错描述:刚学Python，不明白，特来请教。程序是爬取贴吧某个地址的图片，运行正常，图片也都下载下来了。代码如下：importurllib.requestimportreresponse=urllib.request....
python爬虫运行正常最后报错_python爬虫优化和错误日志分析
2020-12-06 11:02

weixin_39917576的博客发现问题在爬虫下载过程中，执行一段时间后都会异常终止，下次必须kill掉进程重新运行，看能否优化并减少手动操作错误日志分析收集了nohup.out文件，发现主要错误是的数组下标越界，推测可能的问题为：1)网络不稳定...
Python网络爬虫headers的字典总是出现换行符这个要怎么处理呀？
2024-06-21 09:03

Python进阶者的博客一、前言前几天在Python钻石交流群【大写一个Y】问了一个Python网络爬虫的问题，问题如下：大佬们问个问题，我写了一个能把源请求头和cookies转换成字典格式的函数，运行之后cookies是成功了的，但是hesders的...
解决爬虫403报错[项目代码]
2025-11-13 06:56

在Python爬虫的开发过程中，程序员常常会遇到403 Forbidden错误，这是一种常见的HTTP响应错误，意味着服务器理解请求但是拒绝执行它。特别是当爬虫以过高的频率向目标网站发送请求时，很容易触发服务器的安全策略，...
python 爬虫，挂VPN后，requests报错
2023-05-31 14:27

YIruizZ的博客在requests请求接口提交数据时，挂上代理 // proxies 必须是key-val形式，而且严格来讲http和https要同时拥有 proxies = { "http": "http://~~", "https": "http://~~", } requests.post(url=url,headers={~~},data=...
一招鲜吃遍天！彻底解决Python爬虫403 Forbidden报错的8种姿势（亲测有效）
2025-05-19 13:58

herobrineAC789的博客检查User-Agent → 2. 添加Referer/Cookie → 3. 使用代理 → 4. 降频 → 5. 换工具如果这些方法都试过了还是不行… 兄弟，考虑下是不是该给...（认真脸）你在爬虫过程中还遇到过哪些奇葩错误？欢迎在评论区留言交流！
【Python报错已解决】`Provisional headers are shown Learn more`
2024-09-05 17:08

鸽芷咕的博客在Web开发中，我们可能会遇到各种HTTP相关的错误。`Provisional headers are shown Learn more` 是一个常见的错误，它通常出现在使用HTTP代理或在进行HTTP请求时。本文将探讨这个错误的原因，并提供解决方案。
python爬虫资源路径报错_Python3 Scrapy爬虫框架使用
2021-01-30 00:09

一笑逢的博客问：把网站装进爬虫需要几步？答：四步。1. 新建项目2. 明确目标3. 制作爬虫4. 存储内容注意：# coding=utf-8 使用Scrapy爬虫框架时应该添加此条语句表明注释是中文注释1. 新建项目使用命令新建一个scrapy项目scrapy...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月14日

爬虫报错，headers也加了为啥还报错呀？

2条回答 默认 最新

问题事件

2条回答默认最新