xpath方法请求出来列表为空，不知道是不是代码编写的问题

利用xpath方法抓取的列表为空
需求：抓取房源的标题，地址，户型，价格
网址：https://changde.58.com/xinfang/?PGTID=0d100000-0036-8bd3-6159-08ef6dac6e41&ClickID=4
有谁可帮我看一下嘛

# 需求：爬取58同城上常德新房的房源信息
import requests
from lxml import etree
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:96.0) Gecko/20100101 Firefox/96.0'
}
# 抓取页面源码数据
url = 'https://changde.58.com/xinfang/?PGTID=0d100000-0036-8511-a0ff-530399c9a35a&ClickID=2'
page_text = requests.get(url=url, headers=headers).text
# 数据解析
tree = etree.HTML(page_text)
div_list = tree.xpath('//div[@class="key-list imglazyload"]/div')

f1 = open('./changDe fangYuan.txt', 'w', encoding='utf-8')
for div in div_list:
    # 局部解析
    items_name = div.xpath('./div/a[1]/span/text()')[0]
    address = div.xpath('./div/a[2]/span/text()')[0]
    HuXing = div.xpath('./div/a[3]/span/text()')[0]
    price = div.xpath('./a[2]/p/span/text()')[0]
    f1.write(items_name+address+HuXing+price)

print('打印成功！')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2022-01-26 11:00
关注
将f1 = open('./changDe fangYuan.txt', 'w', encoding='utf-8')
写成：
f1 = open('fangYuan.txt', 'w', encoding='utf-8')
将f1.write(items_name+address+HuXing+price)改成：
f1.write(items_name+'\n'+address+'\n'+HuXing+'\n'+price)
运行代码，然后在当前目录下生成这个文本文件，打开就可以看到结果了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
Python爬虫 xpath 列表为空 python 有问必答爬虫
2022-03-08 08:32

回答 2 已采纳第二个li的div下少了结束标签导致etree解析出错了少了div结束标签后，etree将建筑类别后的几点全部归类到第二li下了，改下面这样就可以了 import requests from lxm
python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
Python爬取小说源代码，Python实现小说自由
2022-12-26 10:20

本项目名为"Python爬取小说源代码，Python实现小说自由"，旨在利用Python编程语言来自动化下载网络小说，实现无需在线阅读即可拥有全部章节内容的目标。通过这个项目，我们可以学习到以下几个关键的Python爬虫知识点...
关于python的xpath返回空列表的问题求解 python
2022-05-22 11:35

回答 1 已采纳直接用正则匹配啊
从浏览器复制的xpath为什么打出来是个空列表 python 有问必答爬虫
2022-05-13 15:29

回答 2 已采纳积存金是用iframe加载的，在下面这个页面里面https://mybank.icbc.com.cn/icbc/newperbank/perbank3/gold/goldaccrual_query_o
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python xpath定位元素方法_[爬虫]xpath无法定位tbody标签（已解决）
2020-11-24 20:31

mizore的博客 2020.7.15更新以前的讲法有点问题，所以再次更新一下，也算是填坑定位不到tbody是因为标准差异，tbody不是必须存在的chrome的Elements标签页的tbody是肯定存在的但是程序员写的网页不一定会有tbody但是在chrome的...
请教下xpath为什么打印出来的结果是空列表 python
2022-01-16 16:00

回答 1 已采纳找到原因了，网易云音乐的URL需要将#/删除😭
Python使用xpath无论如何都返回空列表 python 有问必答爬虫
2022-02-14 15:59

回答 3 已采纳 tree=etree.HTML('page_text')改为tree=etree.HTML(page_text) 加载变量的值，而不是直接加载page_text这字符，当然无法找到内容
Python爬虫 XPath 爬取的数据为空 python
2021-11-20 15:43

回答 2 已采纳
【Python从入门到进阶】28、xpath的安装以及使用
2023-07-15 10:30

光仔December的博客 XPath是由W3C（World Wide Web Consortium）组织发布的。W3C是一个国际性组织，负责制定Web标准和推动Web技术的发展。XPath最初在1999年发布，并成为XML Path Language的一部分。它由James Clark提出并提交给W3C进行...
有关PYTHON各种采集代码,XPath,requests,Scrapy
2018-01-26 17:37

例如，`lxml`库提供了一个`etree`模块，支持XPath查询，通过`ElementTree`对象的`xpath()`方法，我们可以定位到页面上的特定元素，从而提取所需数据。 requests是Python的一个HTTP客户端库，用于发送HTTP请求，如...
利用Python中的Xpath实现一个在线汇率转换器
2020-09-16 07:50

在本教程中，我们将探讨如何使用Python编程语言和XPath库来创建一个在线汇率转换器。XPath是一种在XML文档中查找信息的语言，也可以用于HTML文档。在这个项目中，我们将利用XPath从网页抓取实时汇率数据，然后进行...
python爬虫requests返回网页内容为空_Python网络爬虫项目：使用requests获取网页，通过xpath提取数据...
2020-11-23 23:07

weixin_39649611的博客本次讲解通过requests获取某...步骤：1、使用pycharm新建项目，新建的时候记得勾选“Inherit global site-packages”否则可能找不到requests类库2、编写代码，我们看到网页上的数据量是101行，如下所示：代码如下：...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月26日

悬赏问题

¥15 PointNet++的onnx模型只能使用一次
¥20 西南科技大学数字信号处理
¥15 有两个非常“自以为是”烦人的问题急期待大家解决！
¥30 STM32 INMP441无法读取数据
¥15 R语言绘制密度图，一个密度曲线内fill不同颜色如何实现
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧，别用大模型回答，大模型的答案没啥用
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。

xpath方法请求出来列表为空，不知道是不是代码编写的问题

6条回答 默认 最新

问题事件

悬赏问题

6条回答默认最新