爬虫报错，headers也加了为啥还报错呀？

前面infos的find＿all没有报错，print（infos）可以成功，但到下面爬具体内容的时候就显示AttributeError: 'NoneType' object has no attribute 'find_all'，请问该怎么解决呀

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Syb呀呀 2021-11-19 14:06

关注

观察了一下此网站，是他的地理位置那一栏的标签顺序有变化，所以find未找到对应的值，导致解析失败无数据，建议换一种解析库，代码如下：

import time
import requests
from lxml import etree
headers={'User-Agent':'',
         'Referer':'https://dl.58.com/zufang/pg2/'} # headers参数自己补充一下，通过测试，只需要Referer和请求头即可
for u in range(1,4):
    url='https://dl.58.com/zufang/pg2/pn'+str(u)+'/'
    print(url)
    res=requests.get(url,headers=headers,proxies=test_IP.proxies)
    dom=etree.HTML(res.text)
    title=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/h2/a/text()")
    area=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p[@class='room']/text()")
    position_1=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p/a[1]/text()")
    position_2=dom.xpath("//div[@class='list-box']/ul[@class='house-list']/li/div[@class='des']/p/a[2]/text()")
    price=dom.xpath("//div[@class='money']/b/text()")
    for i in range(len(title)):
        print('标题为:',title[i].strip())
        print('面积为:',area[i].strip().replace(' ',''))
        print('位置为:',position_1[i]+'\t'+position_2[i])
        print('价格为:',str(price[i])+'元/每月')
        print('----------分割线----------')
    time.sleep(2)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

爬虫报错，headers也加了为啥还报错呀？ python 爬虫
2021-11-14 12:27

回答 2 已采纳观察了一下此网站，是他的地理位置那一栏的标签顺序有变化，所以find未找到对应的值，导致解析失败无数据，建议换一种解析库，代码如下： import time import requests from
我的python爬虫的循环遍历为什么报错？ python 爬虫
2023-01-17 13:25

回答 5 已采纳你把res打印出来看下。应该是request.get方法没有获取到数据，或者获取的数据格式和你想要的不一致，所以报错了。如果是获取的数据不对，检查下您的请求参数是否正确。
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
python 爬虫报错求救
2020-12-22 02:37

raise JSONDecodeError(“Expecting value”, s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)报错! 在找到某度文库文档的js文件链接后想用json.loads()进行解析...
请问这样的python爬虫Header报错应该怎么办？ python 爬虫
2023-01-17 10:14

回答 2 已采纳 request.get那一行要缩进，放到collect的方法里面去，现在看起来是在方法外面啊！请采纳！！
基础爬虫不报错也不下数据 python
2022-07-15 23:48

回答 4 已采纳帮你改好了 ```python import urllib.parse import urllib.request def requert_get(page): first_url
Python 爬虫代码不报错，也不显示爬取内容 python 有问必答
2021-04-22 11:19

回答 4 已采纳代码逻辑问题，main函数里只有计算耗时的部分，没有调用get_html、parse_html等函数。
python爬虫常见报错_python爬虫入门常见错误集合
2020-11-28 12:43

weixin_39911998的博客在入门爬虫的时候遇到不少问题，和不是唯一的解决方法的方法，总结整理一下，供大家学习交流。syntaxerror: invalid syntax语法错误：无效语法syntaxerror: unexpected EOF while parsing语法错误：多了无法解析的...
爬虫为什么遇到了400报错？bad request,，怎么办？ python 爬虫
2022-09-21 15:18

回答 2 已采纳被反爬了，headers里加上cookie试试，有帮助的话采纳一下哦！
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
python爬虫报错，jsonp python 有问必答
2021-06-25 09:46

回答 3 已采纳参数callback去掉 import requests import json headers = {'Host': 'xyq.cbg.163.com', 'Refere
Python 爬虫代码不报错，也不显示爬取内容，求解
2021-12-26 19:31

cortanaji的博客 data=self.formdata,headers= self.headers) return response.content def run(self): #url #header #formdata self.generate_formdata() print(self.formdata) #发送请求，获取相应 data = self.get_data() print...
python爬虫基础小题目报错 python
2022-04-12 13:59

回答 3 已采纳题主，你代码里链接写错了，是点号你写成了逗号 link="http://www.santostang.com/"
python爬虫常见报错_Python爬虫总结——常见的报错、问题及解决方案
2020-11-28 12:43

weixin_39654245的博客在爬虫开发时，我们时常会遇到各种BUG各种问题，下面是我初步汇总的一些报错和解决方案。在以后的学习中，如果遇到其他问题，我也会在这里进行更新。各位如有什么补充，欢迎评论区留言~~~问题：IP被封，或者因访问...
已解决Python爬虫报错＜response [406]＞
2023-02-05 21:43

袁袁袁袁满的博客已解决Python爬虫报错[406]＞
已解决Python爬虫报错＜Response [403]＞
2022-11-11 21:13

袁袁袁袁满的博客已解决Python爬虫报错[403]＞
python爬虫运行正常最后报错_Python爬虫运行正常，最后却报错
2021-03-06 17:10

莫加洛夫的博客问题： Python爬虫运行正常，最后却报错描述:刚学Python，不明白，特来请教。程序是爬取贴吧某个地址的图片，运行正常，图片也都下载下来了。代码如下：importurllib.requestimportreresponse=urllib.request....
python爬虫资源路径报错_python爬虫
2020-12-09 08:18

weixin_39904587的博客一、网络爬虫介绍网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。例如，百度、google搜索某关键字时，就是爬取整个互联网上的相关资源，给呈现出来。实际爬虫四个步骤：...
python 爬虫，挂VPN后，requests报错
2023-05-31 14:27

YIruizZ的博客在requests请求接口提交数据时，挂上代理 // proxies 必须是key-val形式，而且严格来讲http和https要同时拥有 proxies = { "http": "http://~~", "https": "http://~~", } requests.post(url=url,headers={~~},data=...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月14日

悬赏问题

¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法
¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图

爬虫报错，headers也加了为啥还报错呀？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新