python爬取房源，可以运行，但是每次只爬出一条是什么原因？


from lxml import etree
import requests
import csv
import time
 
 
def spider():
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
    }
 
    
    pre_url = 'https://hefei.qfang.com/rent/f'
    for x in range(1, 13):
        html = requests.get(pre_url + str(x), headers=headers)
        time.sleep(2)  # 在每一次GET后，等待2秒
        selector = etree.HTML(html.text)
    # 先获取房源列表
    house_list = selector.xpath("//*[@id='cycleListings']/ul/li")
    for house in house_list:
        xiaoqu = house.xpath("div[2]/div[3]/div/a/text()")[0]
        huxing = house.xpath("div[2]/div[2]/p[1]/text()")[0]
        area = house.xpath("div[2]/div[2]/p[2]/text()")[0]
        month_price = house.xpath("div[3]/p/span[1]/text()")[0]
        
    item = [xiaoqu, huxing, area, month_price]
    data_writer(item)
    print('正在抓取', xiaoqu)
 
 
def data_writer(item):
    with open('qfang_chuzufang.csv','a+',encoding='utf-8',newline='')as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(item)
 
 
if __name__ == '__main__':
    spider()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

亖夕 Python领域新星创作者 2022-09-22 20:20

关注

已修改，爬到不止一页，就是你信息提取包括了一些其他符号，自己再处理一下就好了

from lxml import etree
import requests
import csv
import time


def spider():
    print("stater")
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0'
    }

    pre_url = 'https://hefei.qfang.com/rent/f'
    for x in range(1, 13):
        html = requests.get(pre_url + str(x), headers=headers)
        time.sleep(2)  # 在每一次GET后，等待2秒
        selector = etree.HTML(html.text)
    # 先获取房源列表
        house_list = selector.xpath("//*[@id='cycleListings']/ul/li")
        for house in house_list:
            xiaoqu = house.xpath("div[2]/div[3]/div/a/text()")[0]
            huxing = house.xpath("div[2]/div[2]/p[1]/text()")[0]
            area = house.xpath("div[2]/div[2]/p[2]/text()")[0]
            month_price = house.xpath("div[3]/p/span[1]/text()")[0]

            item = [xiaoqu, huxing, area, month_price]
            print(item)
            # data_writer(item)
            print('正在抓取', xiaoqu)


# def data_writer(item):
#     with open('qfang_chuzufang.csv', 'a+', encoding='utf-8', newline='') as csvfile:
#         writer = csv.writer(csvfile)
#         writer.writerow(item)


if __name__ == '__main__':
    spider()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

python爬取到的网页文本，保存本地txt显示文件为空？什么原因呢？ python 有问必答
2022-04-07 11:17

回答 3 已采纳 w改为a（追加），要不会将当前写入的内容覆盖文件内容要么将open和close放到for循环外
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python爬取并下载的文件为什么是空白且加载不出来？ python
2021-08-08 11:16

回答 2 已采纳你只是爬取了html网页，，怎么能让你运行人家的网页呢你说的加载不出来那是肯定的这个样子应该你只是爬了个外壳，css和js都不能用了，所以背景是白的，按钮都是没有样式的如果明白了，点击右上角给个采纳哦
Python爬取链家成都二手房源信息
2020-10-20 18:09

wade1203的博客一、基本概念并发与并行并发：指在同一时刻只能有一条指令执行，但多个进程指令被快速的轮换执行，使得在宏观上具有多个进程同时执行的效果，但在微观上并不是同时执行的，只是把时间分成若干段，使多个进程快速...
python简单爬虫正常运行遍历，没有报错，但最后csv文件为什么只保存了一条信息 python
2019-07-29 00:53

回答 1 已采纳 with open(r'C:\Users\Administrator\Desktop\python\豆瓣电影分类前100.csv', 'w', newline='', encoding='utf8')
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 19:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
利用Python一键爬取上海二手房信息
2020-09-25 16:57

python程序员小'鹏的博客我在上海工作的时候有朋友就发信息问我上海一些二手房的价格情况，作为一个二愣子我只知道上海哪个区贵，但是不知道具体是什么价格，所以我就想着爬取一下上海的二手房。从政策上来看，自从2016年国家喊出了“ 房主...
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
Python爬虫代码可以运行不报错，也显示第几页爬取成功，但就是文件里啥也没有，空白的，可以给看看是哪里出问题了吗？ python 爬虫
2021-11-13 19:59

回答 2 已采纳有写入csv操作，但csv写入的话不可以用字典传进去，写入代码如下： import csv file=open('文件名字.csv','a',encoding='utf-8',newline='')
大数据毕业设计二手房数据爬取与分析可视化系统 -python
2023-03-15 19:30

caxiou的博客学长分享优质毕业设计项目，今天要分享的是基于大数据招聘岗位数据分析与可视化系统学长这里给一个题目综合评分(每项满分5分)首先通过爬虫采集链家网上所有二手房的房源数据，并对采集到的数据进行清洗；...
python代码一段代码被划横线是什么原因 chrome python 有问必答爬虫
2021-11-30 12:48

回答 5 已采纳这个是提示这个函数已过期，但不影响运行！最好不要用，一般过期函数会有其替代的函数，你可以进入函数实现看看说明就知道了！如果是你来处理后续，我建议是这样做！
小牧用Python 爬取数万条房产数据，揭秘一线城市生存压力有多大
2019-10-25 15:39

LLand520的博客我们也不得而知，于是乎笔者为了一探究竟，便用 Python 爬取了房某下的深圳租房数据。以下是本次的样本数据：除去【不限】的数据（因为可能会与后面重叠），总数据量为 16971 ，其中后半部分地区数据量偏少，是...
python爬取小说章节信息用pygame进行数据显示_爬虫不过如此（python的Re 、Requests、BeautifulSoup 详细篇）...
2020-12-07 14:04

weixin_39645041的博客网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 爬虫的本质就是一段自动抓取互联网信息的程序,从网络获取感兴趣的信息,...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月22日

悬赏问题

¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改

python爬取房源，可以运行，但是每次只爬出一条是什么原因？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新