python xpath解析报错，etree.HTML

#图片解析

import requests
from lxml import etree
import os


if __name__ == '__main__':
    url='https://pic.netbian.com/4kmeishi/'
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
    }
    response=requests.get(url=url,headers=headers)
    #手动设定响应数据的编码格式,手动解决乱码的问题
    #response.encoding='utf-8'
    page_text=response.text
    #实例化对象
    tree=etree.HTML(page_text)
    li_list=tree.xpath('//div[@class="slist"]/ul/li')
    #创建一个文件夹
    if not os.path.exists('./meishi.Libs/'):
        os.mkdir('./meishi.Libs/')
    for li in li_list:
        img_list='https://pic.netbian.com'+li.xpath('./a/img/@src')[0]
        img_name=li.xpath('./a/img/@alt')[0]+'jpg'
        #通用的处理中文乱码的解决方案
        img_name=img_name.encode('iso-8859-1').decode('gbk')

        #请求图片进行持久化存储
        img_date=requests.get(url=img_list,headers=headers).content #content对应的URL后缀一定是 JPG，如果是HTML一定会显示空白
        img_path='./meishi.Libs/'+img_name
        with open(img_path,'wb')as fp:
            fp.write(img_date)
            print(img_name,'下载成功!')

代码如上，报错：

Traceback (most recent call last):
File "C:/Users/忙碌的小仙女/PycharmProjects/爬虫学习/xpath 案例2.py", line 18, in <module>
tree=etree.HTML(page_text)
AttributeError: 'function' object has no attribute 'HTML'

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-05-17 20:08
关注
经测试在vscode终端代码运行正常，尝试升级lxml版本，代码中还有个小问题，在img_name=li.xpath('./a/img/@alt')[0]+'jpg'的jpg前面要加个点，即.jpg，才是一个jpg图片格式文件。运行环境：python3.7.6,lxml4.5.1。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python3 xml.etree.ElementTree支持的XPath语法详解
2020-09-17 18:30

Python3的xml.etree.ElementTree模块提供了一个XML处理...了解并熟练运用XPath与Python3的xml.etree.ElementTree模块相结合，可以有效地解析和操作XML数据，尤其在处理复杂XML结构时，能够提高代码的简洁性和可读性。
Python爬虫记录-etree.HTML解析数据异常
2024-04-07 18:06

Konsh的博客 response = requests.get(url, headers=headers) html_obj = etree.HTML(response.text) comments = html_obj.xpath('//span[@class="XXX"]/text()') 问题出现本以为数据可以正常获取，结果发现程序报错了，报错...
【Python】Xpath 解析报错：lxml.etree.XPathEvalError: Unregistered function
2022-03-20 17:22

骑着蜗牛ひ追导弹'的博客报错 Traceback (most recent call last): File "F:\python3.7.0\lib\code.py", line 90, in runcode exec(code, self.locals) File "<input>", line 1, in <module> File "G:\Projects\...
python etree xpath_Python etree.XPath方法代码示例
2020-12-10 06:13

weixin_39830387的博客本文整理汇总了Python中lxml.etree.XPath方法的典型用法代码示例。如果您正苦于以下问题：Python etree.XPath方法的具体用法？Python etree.XPath怎么用？Python etree.XPath使用的例子？那么恭喜您, 这里精选的方法...
python etree.HTML 以及xpath 解析网页的工具
2023-12-02 16:35

JNU freshman的博客 python etree.HTML 以及xpath 解析网页的工具
python 爬虫基础 Xpath lxml中etree.html和etree.parse有什么区别
2021-07-27 10:58

RooKiChen的博客 1.etree.parse直接接受一个文档，按照文档结构解析（本地文件） test.html: <html> <body> <ul> <li><a href="http//www.baidu.com">百度</a></li> <li><a ...
Python——xml.etree.ElementTree
2024-08-25 14:05

pumpkin84514的博客它提供了简洁且高效的API，适用于解析、创建和修改XML文档。...本身不支持完整的XPath语法，但提供了类似的路径查找功能。库提供了更安全的XML解析方法，防止常见的安全漏洞。都是非常实用的工具。
Python xml.etree.ElementTree 模块深度解析
2025-03-03 08:45

tekin的博客模块为 Python 开发者提供了一种简单而强大的方式来处理 XML 数据。通过将 XML 文档表示为元素树，我们可以方便地进行解析、创建和修改操作。该模块支持基本的元素查找和遍历，还提供了简单的 XPath 支持。然而，在...
使用Python的xml.etree.ElementTree模块解析XML文件
2024-06-06 15:02

_长风_的博客如何使用xml.etree.ElementTree模块来解析XML文件，并提取特定的信息。
pycharm中xpath解析html文件报错：lxml.etree.XPathEvalError: Invalid expression
2023-06-09 15:39

我二天雨哦哦哦的博客错误的代码把span(2)改成span[2] 成功的样子如下
没有解决我的问题, 去提问

python xpath解析报错，etree.HTML

3条回答 默认 最新

3条回答默认最新