爬虫遇到了问题：name 'headers' is not defined，请问如何解决？

from lxml import etree
import requests
import csv
import time
def spider():
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
        }
pre_url='https://hefei.qfang.com/rent/f'
for x in range(1,13):
    html=requests.get(pre_url+str(x),headers=headers)
    time.sleep(2)#在每一次GET后，等待2秒
    selector=etree.HTML(html.text)
#先获取房源列表
house_list=selector.xpath("//*[@id='cycleListings']/ul/li")
for house in house_list:
    xiaoqu=house.xpath("div[2]/div[3]/div/a/text()")[0]
    huxing=house.xpath("div[2]/div[2]/p[1]/text()")[0]
    area=house.xpath("div[2]/div[2]/p[2]/text()")[0]
    month_price=house.xpath("div[3]/p/span[1]/text()")[0]
    people=house.xpath("div/div[2]/div[4]/div[1]/p/a/text()")[0]
    people_picture=house.xpath("/div/div[2]/div[4]/p/a/img/text()")[0]
item=[xiaoqu,huxing,area,month_price,people,people_picture]
data_writer(item)
print('正在抓取',xiaoqu)
def data_writer(item):
    with open()as csvfile:
        writer=csv.writer(csvfile)
        writer.writerow(item)
if __name__ == '__main__':
    spider()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

honestman_ 2022-09-22 17:21

关注

缩进有问题：

from lxml import etree
import requests
import csv
import time


def spider():
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
    }

    
    pre_url = 'https://hefei.qfang.com/rent/f'
    for x in range(1, 13):
        html = requests.get(pre_url + str(x), headers=headers)
        time.sleep(2)  # 在每一次GET后，等待2秒
        selector = etree.HTML(html.text)
    # 先获取房源列表
    house_list = selector.xpath("//*[@id='cycleListings']/ul/li")
    for house in house_list:
        xiaoqu = house.xpath("div[2]/div[3]/div/a/text()")[0]
        huxing = house.xpath("div[2]/div[2]/p[1]/text()")[0]
        area = house.xpath("div[2]/div[2]/p[2]/text()")[0]
        month_price = house.xpath("div[3]/p/span[1]/text()")[0]
        people = house.xpath("div/div[2]/div[4]/div[1]/p/a/text()")[0]
        people_picture = house.xpath("/div/div[2]/div[4]/p/a/img/text()")[0]
    item = [xiaoqu, huxing, area, month_price, people, people_picture]
    data_writer(item)
    print('正在抓取', xiaoqu)


def data_writer(item):
    with open()as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(item)


if __name__ == '__main__':
    spider()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

爬虫遇到了问题：name 'headers' is not defined，请问如何解决？ python 爬虫
2022-09-22 17:19

回答 3 已采纳缩进有问题： from lxml import etree import requests import csv import time def spider(): headers = {
js逆向遇到JSEncrypt is not defined 和 JSEncrypt is not a constructor问题 javascript python 爬虫
2021-08-14 18:07

回答 1 已采纳 ...... ze.version = "2.3.1", JSEncrypt = ze } function get
抄代码明明代码一样却出现down_load(page,content) NameError: name 'content' is not defined的问题 python 有问必答爬虫
2022-03-13 13:25

回答 3 已采纳你这个循环里确实没有提前定义content啊,你是想写response写成content了吧
爬虫超时报错socket.timeout: timed out/NameError: name ‘socket‘ is not defined
2021-06-29 09:10

the_beginner的博客问题一：socket.timeout: timed out 源代码： import urllib.request#获取一个get请求 import urllib.parse #获取一个pos请求 import urllib.error headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win...
re模块出现NameError: name 'r' is not defined，求解答 python
2021-10-31 11:37

回答 1 已采纳 obj2=这一行最后的r.S改成re.S
Python爬虫时遇到问题： json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) json python 爬虫
2022-07-23 12:09

回答 3 已采纳
爬虫报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not function，如何解决？ pycharm python 有问必答爬虫
2022-01-26 20:48

回答 2 已采纳这一行写错了参数值，是False不是false,f要大写，response = requests.get(url, headers=headers, verify=False)另外函数get_ip要写
python request is not defined_【Python】Python包问题处理,以及爬虫的一些参考
2021-01-28 18:25

沈仙君的博客写成from urllib import request，也错误： name 'urllib' is not defined。要写成如下形式： from urllib.request import urlopen response=urlopen("http://www.baidu.com ") #不能写成response=urllib.request....
爬虫错误TypeError: 'str' object is not callable python
2021-06-21 17:26

回答 1 已采纳 resp = requests.get(url,headers=headers,data=dat) 用的是get resp.close()做什么的?
关于#天猫反爬虫#的问题，如何解决？ python 爬虫
2022-08-15 18:55

回答 2 已采纳你这样去爬天猫肯定是要被反爬的，代理都不加上，如果数据量小，可以加上代理跑一跑，但是如果数据量比较大的话，你是绕不开滑块验证码的，而出不出现验证码是根据你的cookie来决定的，提供一个大批量跑的思路
在用python进行上交所爬虫时遇到这样的问题，请问需要怎么解决 json python 有问必答爬虫
2021-11-05 22:54

回答 2 已采纳检查代码中第30行json_str，存在json无法解析的数据，参考一下json.loads的数据结构类似于：jsonData = '{"a":1,"b":2,"c":3,"d":4,"e":5}'
爬虫实战遇到的问题及解决汇总 / 爬虫原理介绍
2020-01-26 21:22

Quest_sec的博客如何写一个爬虫程序爬取豆瓣内容？
爬虫js逆向获取信息，有道翻译逆向{‘errorCode‘: 50}及UA错误
2022-10-12 00:06

Hares_的博客加上console.log(r('编程')) 去测试发现报错缺少内容： ReferenceError: md5 is not defined 回到寻找数据因为设置了短点，所以鼠标移过去能看见信息，点击此处就能进入md5的相关代码位置进行复制（切记获取方法...
【日常】爬虫技巧进阶：textarea的value修改与提交问题（以智谱清言为例）
2023-11-17 23:22

囚生CY的博客我很喜欢在爬虫中遇到问题，因为这意味着在这个看似简单的事情里还是有很多值得去探索的新东西。其实本身爬虫也是随着前后端技术的不断更新在进步的。文章目录序言 Preliminary 1 问题缘起 1.1 Selenium长文本...
JS逆向——一个新的视频爬虫
2021-07-23 16:48

s_kangkang_A的博客 url) if __name__ == '__main__': parse() 在代码的注释里写的很清楚了值得注意的是一个报错： execjs._exceptions.ProgramError: ReferenceError: CryptoJS is not defined 这也是一个很大的坑，所以在源码匹配到...
爬虫第八式：破解百度翻译案例（特别详细） - JS逆向
2020-12-25 21:23

杨旭华　的博客爬虫玩得好，监狱进得早。数据玩得溜，牢饭吃个够。《刑法》第 285 条，非法获取计算机信息系统数据罪。违反国家规定，侵入前款规定以外的计算机信息系统或者采用...
python爬虫实战01：爬取天气网天气
2020-08-24 16:30

No、oneseer的博客 python爬虫实战01：爬取天气网天气文章目录python爬虫实战01：爬取天气网天气1.介绍2.完整代码3.外部调用 1.介绍 python3使用urllib和BeautifulSoup模块爬取天气网的信息: https://www.tianqi.com/. 2.完整代码 ...
python3 爬虫相关学习7：使用 BeautifulSoup下载网页图片到本地文件夹
2023-06-06 21:36

奔跑的犀牛先生的博客 bs4后，问题可以解决 3 如果选择在anaconda下使用 bs4 (BeautifulSoup) 3.1 anaconda下运行python，跑这个脚本 3.2 遇到报错1：ImportError: cannot import name 'beautifulsoup' from 'bs4' 要注意BeautifulSoup ...
爬虫 Scrapy框架"链家爬取"
2018-11-12 20:19

Meter_Bulacn的博客这是项目文件里面的spider文件里的主文件所有的爬虫流程都在这里: # -*- coding: utf-8 -*- import scrapy from lianjia . items import LianjiaItem class JiaSpider ( scrapy . Spider ) : name ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月22日

悬赏问题

¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 qgcomp混合物线性模型分析的代码出现错误：Model aliasing occurred
¥100 已有python代码，要求做成可执行程序，程序设计内容不多
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助
¥15 STM32控制MAX7219问题求解答
¥20 在本地部署CHATRWKV时遇到了AttributeError: 'str' object has no attribute 'requires_grad'

爬虫遇到了问题：name 'headers' is not defined，请问如何解决？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新