python爬虫使用xpath提取信息部分失败

用xpath提取猪八戒网的数据，为啥一半提取成功一半空列表

import requests
from lxml import etree

url = "https://beijing.zbj.com/search/service/?l=0&kw=saas&r=2"
resp = requests.get(url)
# print(resp.text)

# 把html源码进行加载解析
html = etree.HTML(resp.text)
# 拿到每一个服务商的div
divs = html.xpath('//*[@id="__layout"]/div/div[3]/div[1]/div[4]/div/div[2]/div[1]/div')
# print(divs)
for div in divs:  # 每一个服务商信息
    price = div.xpath("./div/div[2]/div[1]/span/text()")
    title = div.xpath("./div/a/div[2]/div[1]/div/text()")
    print(price)
    print(title)

resp.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CQ.abc 2023-04-09 21:16
关注
以下回答结合了ChatGPT：
这段代码没有使用socket连接获取HTML内容，而是使用了requests库发送HTTP GET请求获取HTML内容。如果你已经获取到了HTML内容，可以使用base64和webbrowser模块将其在浏览器中打开。

以下是将HTML内容转换为base64编码并在浏览器中打开的代码：

import base64 import webbrowser # 将HTML内容转换为base64编码 html_content = resp.text.encode('utf-8') html_base64 = base64.b64encode(html_content).decode('utf-8') # 将base64编码后的HTML内容嵌入到data URI中 html_data_uri = 'data:text/html;base64,' + html_base64 # 在浏览器中打开HTML内容 webbrowser.open(html_data_uri)

注意，这段代码中的resp变量应该是从之前的代码中获取到的requests响应对象。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫实战之xpath解析
2022-08-01 19:59

阿浩(￣▽￣)的博客 XPath是一门在XML文档中查找信息的语言，最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。所以在Python爬虫中，我们经常使用xpath解析这种高效便捷的方式来提取信息。
Python3爬虫——用Xpath提取网页信息
2023-02-04 18:59

甲寅Emore的博客本文概述了Python3利用Xpath获得网页信息并返回的方法，内容有 Xpath的梗概和安装 Xpath常用规则使用Xpath 接入HTML文本从内存中读取从文件中读取查找节点所有节点指定节点属性多值匹配多属性匹配选择顺序 ...
【Python爬虫详解】第四篇：使用解析库提取网页数据——XPath
2025-04-24 16:30

Luck_ff0810的博客通常比BeautifulSoup更快，特别是在处理大型文档时跨平台通用：几乎所有编程语言都有XPath的实现灵活性高：可以通过各种轴、谓词和函数构建复杂的选择条件在Python中，我们主要通过lxml库来使用XPath功能。...
Python使用xpath爬取网站数据
2025-04-03 17:28

Python是一种解释型、面向对象、高級语言，其语法简洁明了，易于学习和使用。它拥有强大的标准库支持，可以轻松实现多种功能，包括网络编程、文件操作和数据处理等。而Python的数据爬取主要依赖于第三方库，比如...
Python中XPath爬虫实例详细解析
2025-07-15 14:36

其中，使用XPath技术进行网页内容的提取是网络爬虫开发中的一项基础且重要的技能。 XPath（XML Path Language）是一种在XML文档中查找信息的语言，也适用于HTML。它提供了一种灵活的方式来进行元素定位，使得我们...
python爬虫使用selenium 实现中英互译
2022-03-23 14:30

Python爬虫技术在数据获取和自动化测试中扮演着重要角色，而Selenium作为一个强大的Web浏览器自动化工具，常常被用于模拟真实用户操作，如点击、滚动、填写表单等。在这个项目中，我们专注于使用Selenium实现中英...
Python爬虫学习笔记_DAY_20_Python爬虫之xpath的使用方法介绍【Python爬虫】
2022-02-06 22:47

跳探戈的小龙虾的博客 XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中对元素和属性进行遍历。通俗的说，xpath可以用来精确的定位和切割某个标签，标签指的是我们的html文件的源码中的标签，例如<div></div&gt...
【Python】爬虫之xpath的基本使用（文末附带整理好的籽料）
2024-10-24 16:13

宇宙大豹发的博客 8、上面我们使用绝对路径，查找了所有a标签的属性等于href属性值，利用的是/—绝对路径，下面我们使用相对路径，查找一下l相对路径下li标签下的a标签下的href属性的值，注意，a标签后面需要双//。7、上面我们找到...
python爬虫实战开发之bs4应用和xpath结合实战操作.zip
2024-11-15 13:45

在Python爬虫中，XPath配合像lxml或xml.etree.ElementTree这样的库使用，可以快速定位到特定的元素。XPath的表达式非常强大，能够进行复杂的查询操作，但相对于BeautifulSoup，它的学习曲线可能更陡峭一些，特别是在...
Python爬虫之XPath解析库
2022-11-04 14:16

戎笔的博客 XPath，全称XML Path Language，即XML路径语言，拥有简单明了的路径选择表达式，提供有100个内建函数，实现对字符串、数值、时间的匹配以及节点、序列的处理。应用于在XML文档中查找信息的语言，适用于HTML文档的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月9日

python爬虫使用xpath提取信息部分失败

2条回答 默认 最新

问题事件

2条回答默认最新