爬虫遇到了问题：name 'headers' is not defined，请问如何解决？

from lxml import etree
import requests
import csv
import time
def spider():
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
        }
pre_url='https://hefei.qfang.com/rent/f'
for x in range(1,13):
    html=requests.get(pre_url+str(x),headers=headers)
    time.sleep(2)#在每一次GET后，等待2秒
    selector=etree.HTML(html.text)
#先获取房源列表
house_list=selector.xpath("//*[@id='cycleListings']/ul/li")
for house in house_list:
    xiaoqu=house.xpath("div[2]/div[3]/div/a/text()")[0]
    huxing=house.xpath("div[2]/div[2]/p[1]/text()")[0]
    area=house.xpath("div[2]/div[2]/p[2]/text()")[0]
    month_price=house.xpath("div[3]/p/span[1]/text()")[0]
    people=house.xpath("div/div[2]/div[4]/div[1]/p/a/text()")[0]
    people_picture=house.xpath("/div/div[2]/div[4]/p/a/img/text()")[0]
item=[xiaoqu,huxing,area,month_price,people,people_picture]
data_writer(item)
print('正在抓取',xiaoqu)
def data_writer(item):
    with open()as csvfile:
        writer=csv.writer(csvfile)
        writer.writerow(item)
if __name__ == '__main__':
    spider()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

honestman_ 2022-09-22 17:21

关注

缩进有问题：

from lxml import etree
import requests
import csv
import time


def spider():
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
    }

    
    pre_url = 'https://hefei.qfang.com/rent/f'
    for x in range(1, 13):
        html = requests.get(pre_url + str(x), headers=headers)
        time.sleep(2)  # 在每一次GET后，等待2秒
        selector = etree.HTML(html.text)
    # 先获取房源列表
    house_list = selector.xpath("//*[@id='cycleListings']/ul/li")
    for house in house_list:
        xiaoqu = house.xpath("div[2]/div[3]/div/a/text()")[0]
        huxing = house.xpath("div[2]/div[2]/p[1]/text()")[0]
        area = house.xpath("div[2]/div[2]/p[2]/text()")[0]
        month_price = house.xpath("div[3]/p/span[1]/text()")[0]
        people = house.xpath("div/div[2]/div[4]/div[1]/p/a/text()")[0]
        people_picture = house.xpath("/div/div[2]/div[4]/p/a/img/text()")[0]
    item = [xiaoqu, huxing, area, month_price, people, people_picture]
    data_writer(item)
    print('正在抓取', xiaoqu)


def data_writer(item):
    with open()as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(item)


if __name__ == '__main__':
    spider()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

爬虫遇到了问题：name 'headers' is not defined，请问如何解决？ python 爬虫
2022-09-22 17:19

回答 3 已采纳缩进有问题： from lxml import etree import requests import csv import time def spider(): headers = {
js逆向遇到JSEncrypt is not defined 和 JSEncrypt is not a constructor问题 javascript python 爬虫
2021-08-14 18:07

回答 1 已采纳 ...... ze.version = "2.3.1", JSEncrypt = ze } function get
抄代码明明代码一样却出现down_load(page,content) NameError: name 'content' is not defined的问题 python 有问必答爬虫
2022-03-13 13:25

回答 3 已采纳你这个循环里确实没有提前定义content啊,你是想写response写成content了吧
爬虫超时报错socket.timeout: timed out/NameError: name ‘socket‘ is not defined
2021-06-29 09:10

the_beginner的博客问题一：socket.timeout: timed out 源代码： import urllib.request#获取一个get请求 import urllib.parse #获取一个pos请求 import urllib.error headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win...
re模块出现NameError: name 'r' is not defined，求解答 python
2021-10-31 11:37

回答 1 已采纳 obj2=这一行最后的r.S改成re.S
爬虫报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not function，如何解决？ pycharm python 有问必答爬虫
2022-01-26 20:48

回答 2 已采纳这一行写错了参数值，是False不是false,f要大写，response = requests.get(url, headers=headers, verify=False)另外函数get_ip要写
爬虫错误TypeError: 'str' object is not callable python
2021-06-21 17:26

回答 1 已采纳 resp = requests.get(url,headers=headers,data=dat) 用的是get resp.close()做什么的?
python request is not defined_【Python】Python包问题处理,以及爬虫的一些参考
2021-01-28 18:25

沈仙君的博客写成from urllib import request，也错误： name 'urllib' is not defined。要写成如下形式： from urllib.request import urlopen response=urlopen("http://www.baidu.com ") #不能写成response=urllib.request....
关于#天猫反爬虫#的问题，如何解决？ python 爬虫
2022-08-15 18:55

回答 2 已采纳你这样去爬天猫肯定是要被反爬的，代理都不加上，如果数据量小，可以加上代理跑一跑，但是如果数据量比较大的话，你是绕不开滑块验证码的，而出不出现验证码是根据你的cookie来决定的，提供一个大批量跑的思路
请问这样的python爬虫Header报错应该怎么办？ python 爬虫
2023-01-17 10:14

回答 2 已采纳 request.get那一行要缩进，放到collect的方法里面去，现在看起来是在方法外面啊！请采纳！！
在用python进行上交所爬虫时遇到这样的问题，请问需要怎么解决 json python 有问必答爬虫
2021-11-05 22:54

回答 2 已采纳检查代码中第30行json_str，存在json无法解析的数据，参考一下json.loads的数据结构类似于：jsonData = '{"a":1,"b":2,"c":3,"d":4,"e":5}'
爬虫实战遇到的问题及解决汇总 / 爬虫原理介绍
2020-01-26 21:22

Quest_sec的博客如何写一个爬虫程序爬取豆瓣内容？
爬虫js逆向获取信息，有道翻译逆向{‘errorCode‘: 50}及UA错误
2022-10-12 00:06

Hares_的博客加上console.log(r('编程')) 去测试发现报错缺少内容： ReferenceError: md5 is not defined 回到寻找数据因为设置了短点，所以鼠标移过去能看见信息，点击此处就能进入md5的相关代码位置进行复制（切记获取方法...
爬虫第八式：破解百度翻译案例（特别详细） - JS逆向
2020-12-25 21:23

杨旭华　的博客爬虫玩得好，监狱进得早。数据玩得溜，牢饭吃个够。《刑法》第 285 条，非法获取计算机信息系统数据罪。违反国家规定，侵入前款规定以外的计算机信息系统或者采用...
【日常】爬虫技巧进阶：textarea的value修改与提交问题（以智谱清言为例）
2023-11-17 23:22

囚生CY的博客我很喜欢在爬虫中遇到问题，因为这意味着在这个看似简单的事情里还是有很多值得去探索的新东西。其实本身爬虫也是随着前后端技术的不断更新在进步的。文章目录序言 Preliminary 1 问题缘起 1.1 Selenium长文本...
Python：基础&爬虫
2024-06-07 16:16

懒大王爱吃狼的博客 Python：基础&爬虫
JS逆向——一个新的视频爬虫
2021-07-23 16:48

s_kangkang_A的博客 url) if __name__ == '__main__': parse() 在代码的注释里写的很清楚了值得注意的是一个报错： execjs._exceptions.ProgramError: ReferenceError: CryptoJS is not defined 这也是一个很大的坑，所以在源码匹配到...
python爬虫实战01：爬取天气网天气
2020-08-24 16:30

No、oneseer的博客 python爬虫实战01：爬取天气网天气文章目录python爬虫实战01：爬取天气网天气1.介绍2.完整代码3.外部调用 1.介绍 python3使用urllib和BeautifulSoup模块爬取天气网的信息: https://www.tianqi.com/. 2.完整代码 ...
爬虫 Scrapy框架"链家爬取"
2018-11-12 20:19

Meter_Bulacn的博客这是项目文件里面的spider文件里的主文件所有的爬虫流程都在这里: # -*- coding: utf-8 -*- import scrapy from lianjia . items import LianjiaItem class JiaSpider ( scrapy . Spider ) : name ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月22日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

爬虫遇到了问题：name 'headers' is not defined，请问如何解决？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新