python xpath解析报错，etree.HTML

#图片解析

import requests
from lxml import etree
import os


if __name__ == '__main__':
    url='https://pic.netbian.com/4kmeishi/'
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
    }
    response=requests.get(url=url,headers=headers)
    #手动设定响应数据的编码格式,手动解决乱码的问题
    #response.encoding='utf-8'
    page_text=response.text
    #实例化对象
    tree=etree.HTML(page_text)
    li_list=tree.xpath('//div[@class="slist"]/ul/li')
    #创建一个文件夹
    if not os.path.exists('./meishi.Libs/'):
        os.mkdir('./meishi.Libs/')
    for li in li_list:
        img_list='https://pic.netbian.com'+li.xpath('./a/img/@src')[0]
        img_name=li.xpath('./a/img/@alt')[0]+'jpg'
        #通用的处理中文乱码的解决方案
        img_name=img_name.encode('iso-8859-1').decode('gbk')

        #请求图片进行持久化存储
        img_date=requests.get(url=img_list,headers=headers).content #content对应的URL后缀一定是 JPG，如果是HTML一定会显示空白
        img_path='./meishi.Libs/'+img_name
        with open(img_path,'wb')as fp:
            fp.write(img_date)
            print(img_name,'下载成功!')

代码如上，报错：

Traceback (most recent call last):
File "C:/Users/忙碌的小仙女/PycharmProjects/爬虫学习/xpath 案例2.py", line 18, in <module>
tree=etree.HTML(page_text)
AttributeError: 'function' object has no attribute 'HTML'

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-05-17 20:08
关注
经测试在vscode终端代码运行正常，尝试升级lxml版本，代码中还有个小问题，在img_name=li.xpath('./a/img/@alt')[0]+'jpg'的jpg前面要加个点，即.jpg，才是一个jpg图片格式文件。运行环境：python3.7.6,lxml4.5.1。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python xpath解析报错，etree.HTML python 有问必答
2021-05-17 19:37

回答 3 已采纳经测试在vscode终端代码运行正常，尝试升级lxml版本，代码中还有个小问题，在img_name=li.xpath('./a/img/@alt')[0]+'jpg'的jpg前面要加个点，即.jpg，
python报错：lxml.etree.XPathEvalError: Invalid expression，如何解决？ python 有问必答
2022-03-30 23:22

回答 2 已采纳 Bigtit_list = html.xpath('//<div[@class="book-mid-info"]/h2/a/text()') div前面的<去掉改成 Bigtit_li
Python无法使用xpath解析带命名空间的html标签 html python 爬虫
2022-04-13 10:57

回答 1 已采纳 xml.etree.ElementTree --- ElementTree XML API基本库了解一下解析带有命名空间的 XML 如果 XML 输入带有命名空间，则具有前缀的 prefix:s
Python3 xml.etree.ElementTree支持的XPath语法详解
2020-09-17 18:30

主要介绍了Python3 xml.etree.ElementTree支持的XPath语法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
PYTHON etree无法获得数据 python 爬虫
2021-08-27 14:40

回答 2 已采纳代码书写没问题，是你ps = tree.xpath('//head/text()')匹配的原因。
python的xpath问题 python 有问必答
2022-04-06 14:17

回答 4 已采纳 import requests from lxml import etree url = "http://finance.sina.com.cn/zl/china/2022-04-06/zl-im
python类调用报错 python 爬虫
2022-04-13 17:31

回答 2 已采纳 get_tar_urls 写错了，应该是get_target_urls望采纳
【Python】Xpath 解析报错：lxml.etree.XPathEvalError: Unregistered function
2022-03-20 17:22

骑着蜗牛ひ追导弹'的博客报错 Traceback (most recent call last): File "F:\python3.7.0\lib\code.py", line 90, in runcode exec(code, self.locals) File "<input>", line 1, in <module> File "G:\Projects\...
这个报错是什么意思？要怎么解决？ python vscode
2022-09-02 09:58

回答 3 已采纳你的Xpath不对，按F12，选中需要提取的xpath，右键复制xpath，
python爬虫通过xpath无法正常解析欲爬取元素 html python 爬虫
2022-01-04 18:04

回答 2 已采纳我是JAVA的xpath html.xpath("//table[@id='main_table_countries_today']/tbody/tr[@style=' ']").你看着修改下
python爬虫，etree模块有问题 python 爬虫
2022-07-02 00:17

回答 1 已采纳你HtML 中T写成小写了, HTML应该是全大写另外 li 是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本print(li+'\n')fp.write(li+'\
python etree xpath_Python etree.XPath方法代码示例
2020-12-10 06:13

weixin_39830387的博客本文整理汇总了Python中lxml.etree.XPath方法的典型用法代码示例。如果您正苦于以下问题：Python etree.XPath方法的具体用法？Python etree.XPath怎么用？Python etree.XPath使用的例子？那么恭喜您, 这里精选的方法...
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python etree.HTML 以及xpath 解析网页的工具
2023-12-02 16:35

JNU freshman的博客 python etree.HTML 以及xpath 解析网页的工具
python 爬虫基础 Xpath lxml中etree.html和etree.parse有什么区别
2021-07-27 10:58

RooKiChen的博客 1.etree.parse直接接受一个文档，按照文档结构解析（本地文件） test.html: <html> <body> <ul> <li><a href="http//www.baidu.com">百度</a></li> <li><a ...
没有解决我的问题, 去提问

悬赏问题

¥15 运动想象脑电信号数据集.vhdr
¥15 三因素重复测量数据R语句编写，不存在交互作用
¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目

python xpath解析报错，etree.HTML

3条回答 默认 最新

悬赏问题

3条回答默认最新