xpath爬虫网页返回结果为空，请问该如何解决？

xpath爬虫网页返回结果为空

代码如下：

import urllib.request
import urllib.parse
from lxml import etree
 
def query(content):
    # 请求地址
    url = 'https://bk.bd.com/item/' + urllib.parse.quote(content)
    # 请求头部
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
    }
    # 利用请求地址和请求头部构造请求对象
    req = urllib.request.Request(url=url, headers=headers, method='GET')
    # 发送请求，获得响应
    response = urllib.request.urlopen(req)
    # 读取响应，获得文本
    text = response.read().decode('utf-8')
    # 构造 _Element 对象
    html = etree.HTML(text)
    # 使用 xpath 匹配数据，得到匹配字符串列表
    sen_list = html.xpath('//div[contains(@class,"lemma-summary") or contains(@class,"lemmaWgt-lemmaSummary")]//text()')
    # 过滤数据，去掉空白
    sen_list_after_filter = [item.strip('\n') for item in sen_list]
    # 将字符串列表连成字符串并返回
    return ''.join(sen_list_after_filter)
 
if __name__ == '__main__':
    while (True):
        content = input('查询词语：')
        result = query(content)
        print("查询结果：%s" % result)

请赐教，不胜感激。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-01-16 14:53
关注
你可以看下这个问题的回答https://ask.csdn.net/questions/7643372
你也可以参考下这篇文章：Python用xpath爬取数据返回空列表解决 python爬虫，关于使用xpath写爬虫获取不到内容，获取到空列表的解决方案
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫实战之xpath解析
2022-08-01 19:59

阿浩(￣▽￣)的博客 XPath是一门在XML文档中查找信息的语言，最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。所以在Python爬虫中，我们经常使用xpath解析这种高效便捷的方式来提取信息。
Python网络爬虫-详解XPath匹配网页数据
2024-04-23 23:55

程序小勇的博客 XPath，全称XML Path Language，即XML路径语言，它是一门在XML文档中查找信息的语言。XPath使用路径表达式来选取XML文档中的节点或节点集。这些节点是通过沿着路径（path）或者步（steps）来选取的。XPath不仅可以...
【Python爬虫详解】第四篇：使用解析库提取网页数据——XPath
2025-04-24 16:30

Luck_ff0810的博客语法强大：可以通过简洁的表达式精确定位元素高效性能：通常比BeautifulSoup更快，特别是在处理大型文档时跨平台通用：几乎所有编程语言都有XPath的实现灵活性高：可以通过各种轴、谓词和函数构建复杂的选择条件在...
Python3爬虫——用Xpath提取网页信息
2023-02-04 18:59

甲寅Emore的博客本文概述了Python3利用Xpath获得网页信息并返回的方法，内容有 Xpath的梗概和安装 Xpath常用规则使用Xpath 接入HTML文本从内存中读取从文件中读取查找节点所有节点指定节点属性多值匹配多属性匹配选择顺序 ...
Python 爬虫实战：XPath 语法详解，高效定位 XML/HTML 节点
2025-10-17 23:48

python 爬虫工程师的博客本文系统介绍了XPath技术在网页数据解析中的应用，主要包含以下...文章强调XPath在复杂网页解析中的优势，适合需要精准定位和高效提取数据的爬虫开发场景，同时建议根据实际需求选择合适的解析工具或组合使用多种技术
python——requests+xpath实现爬虫
2024-05-14 22:18

会逃跑的乌龟的博客本文章主要介绍使用python，通过requests+Xpath 爬虫的技术学习和实例。
Python爬虫，用xpath爬取豆瓣电影！
2024-11-20 15:40

Python_trys的博客 response.concent:返回的是一个原生的字符串，就是从网页上抓取下来的，没有经过解码的字符串，是bytes类型。response.text:返回的是一个经过解码后的字符串，是str（unicode）类型。2.获取ul、li下的 ‘title’、...
Java + 基于 jsoup 与 xpath 的 Android 网络小说多源爬虫！.zip
2026-01-07 09:32

本文将介绍一个基于Java语言，使用jsoup和xpath技术开发的Android网络小说多源爬虫项目。首先，jsoup是一个强大的Java库，它能够从网页中抓取和操作数据。它支持HTML5文档模型，提供了简单易用的API来解析HTML文档...
php用xpath解析html的代码实例讲解
2021-01-20 08:17

- `DOMXPath::query`：执行XPath查询并返回结果集。总结： XPath在PHP中用于HTML和XML处理时提供了强大的功能，它可以精确地定位和提取所需的数据。通过结合使用`simplexml_load_file`、`DOMDocument`和`DOMXPath`...
简单的python网页爬虫
2023-03-21 11:17

Python作为一种强大的编程语言，因其简洁明了的语法和丰富的库支持，在数据抓取领域被广泛使用。本教程将带你走进Python爬虫的世界，以网易新闻网站为例，逐步介绍如何构建一个简单的网页爬虫。首先，我们要了解...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日

xpath爬虫网页返回结果为空，请问该如何解决？

2条回答 默认 最新

问题事件

2条回答默认最新