python3中使用xpath无法定位，为什么一直返回空列表？

这几天在学习xpath的时候发现无法正确定位，返回的div_list都是空列表，但response信息是有正确返回的。可是怎么检查也没发现错误，希望大佬们麻烦看看，谢谢。
python版本3.6.

    def select_html(self,response):   #筛选网页信息
        html = etree.HTML(response)
        #分组
        div_list = html.xpath("//div[@id='content-left']/div")
        print(div_list)
        for line in div_list:
            data = {}
            data['content'] = line.xpath(".//div[@class='content']/span/text()")
            data['stats'] = line.xpath(".//div[@class='stats']/span[@class='stats-vote']/i/text()")
            data['comment_number'] = line.xpath(".//span[@class='stats-comments']/a/i/text()")
            data['img'] = 'https:'+ line.xpath(".//div[@class='thumb']/a/img/@src")

爬的是糗事百科的内容，下面是糗事百科的html截图：
图片说明

另附上糗百原址：
https://www.qiushibaike.com/hot/page/

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

下羽 2019-01-12 20:24

关注

最后一句会报错，去掉最后一句正常运行，可以参考下我的代码看看问题出现在哪：

from lxml import etree
import requests

url = 'https://www.qiushibaike.com/hot/'

r = requests.get(url)
try:
    r.raise_for_status()

    html = etree.HTML(r.text)
    div_list = html.xpath("//div[@id='content-left']/div")
    for line in div_list:
        data = {}
        data['content'] = line.xpath(".//div[@class='content']/span/text()")
        data['stats'] = line.xpath(".//div[@class='stats']/span[@class='stats-vote']/i/text()")
        data['comment_number'] = line.xpath(".//span[@class='stats-comments']/a/i/text()")
        # data['img'] = 'https:'+ line.xpath(".//div[@class='thumb']/a/img/@src") # 这一句会报错

        print(data)
except:
    print('获取网页失败')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

python xpath定位不到_python3中使用xpath无法定位，为什么一直返回空列表？
2020-12-04 04:39

weixin_39598472的博客 tbody问题:在爬去某些网站一些信息的时候，xpath工具上显示类容是正确的，但是在scrapy代码中一直返回空列表Scrapy的部分代码：class LotteryspiderSpider(scrapy.Spider):#爬虫名字name = 'LotterySpider'#允许的...
python xpath text 空_python3中使用xpath无法定位，为什么一直返回空列表？
2020-12-11 01:06

weixin_39986171的博客 tbody问题:在爬去某些网站一些信息的时候，xpath工具上显示类容是正确的，但是在scrapy代码中一直返回空列表Scrapy的部分代码：class LotteryspiderSpider(scrapy.Spider):#爬虫名字name = 'LotterySpider'#允许的...
关于python使用xpath爬取网页内容返回值为空列表的解决方法
2023-09-16 20:30

妄想...的博客 1、首先看看你的这段代码中是否有 "tbody"存在，把"tbody"去掉。
Python用xpath爬取数据返回空列表解决
2018-12-08 16:20

SL_World的博客笔者以爬取2018年AAAI人工智能顶会论文元数据为例。其中包括标题(title)和摘要(abstract)等字段 ①tbody问题 URL:2018AAAI的第一篇论文元数据页面页面如下：笔者通过谷歌浏览器选取上图红框内容的xpath如下...
python爬取数据返回空列表_Python用xpath爬取数据返回空列表解决
2020-11-29 14:04

weixin_39918043的博客笔者以爬取2018年AAAI人工智能顶会论文元数据为例。其中包括标题(title)和摘要(abstract)等字段前言：首先需要查看该网页是否可以爬取，通过在URL后加入/robots,txt可以查看。①tbody问题笔者通过谷歌浏览器选取上图...
Python3 xml.etree.ElementTree支持的XPath语法详解
2020-09-17 18:30

如果到达文档的根节点，将返回`None`或空列表。 - `//`：选择当前元素下所有级别的子元素。但是，XPath表达式不能以`//`开头作为起始路径。 3. **属性选择**： - `[@attrib]`：选择具有指定属性`attrib`的所有...
python爬取数据返回空列表_Xpath在选择器中正确，在代码中返回的是空列表问题...
2020-11-29 14:04

weixin_39712865的博客是元素中有tbody的原因，这个元素是html生成时产生的，在使用xpath解析的时候无法解析，因此返回的列表为空值。2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()三、解决办法...
python xpath 返回列表为空求解
2021-08-30 19:59

zlwyp的博客 python url='https://www.pearvideo.com/category_31' headers=headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'} se=...
python中xpath定位下拉菜单_Selenium+python --定位下拉列表框并选取内容
2021-01-15 01:47

不要再改名字了的博客 follow yoyo定位下拉列表并选取内容# coding:utf-8from selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsfrom selenium .webdriver.support.select import Selectdriver...
【Python XPath】使用XPath返回空值
2022-03-22 07:33

飝鱻.的博客可还是返回了坑空列表于是去网上查询，得到结果：浏览器会对html文本进行一定的规范化，所以会自动在路径中加入tbody，导致读取失败，在此处直接在路径中去除tbody即可。于是将XPath语句写成: //*[@id="billboard...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
请采纳用户回复 7月7日

python3中使用xpath无法定位，为什么一直返回空列表？

3条回答 默认 最新

问题事件

3条回答默认最新