etree解析html编码问题

python 用etree 解析html文件出来是一个地址：

代码：

    response = requests.get(Url, headers=Headers)
    response.encoding = 'utf-8'
    html = etree.HTML(response.text)
    print(html)
    print(type(html))

结果

<Element html at 0x1e797aa8cc0>
<class 'lxml.etree._Element'>

以下方法都试过无效

    res = requests.get(url)
    html = etree.HTML(res.content )

    res = requests.get(url)
    html_text = bytes(bytearray(res.text, encoding='utf-8'))
    html = etree.HTML(html_text)

print response.text 是有内容的，网页也是 utf 8编码， etree 解析之后就返回一个元素地址，哪里出了问题？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-08-22 20:22
关注
没有问题，这是一个html对象，后续直接可以调用xpath方法定位元素就行

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

etree解析html编码问题爬虫
2022-08-22 19:48

回答 2 已采纳没有问题，这是一个html对象，后续直接可以调用xpath方法定位元素就行
python xpath解析报错，etree.HTML python 有问必答
2021-05-17 19:37

回答 3 已采纳经测试在vscode终端代码运行正常，尝试升级lxml版本，代码中还有个小问题，在img_name=li.xpath('./a/img/@alt')[0]+'jpg'的jpg前面要加个点，即.jpg，
python爬虫，etree模块有问题 python 爬虫
2022-07-02 00:17

回答 1 已采纳你HtML 中T写成小写了, HTML应该是全大写另外 li 是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本print(li+'\n')fp.write(li+'\
python后端技术点_一文带你了解Python四种常见基础爬虫方法介绍
2020-12-20 05:56

weixin_39887546的博客 XPath 可用来在 XML 文档中对元素和属性进行遍历 from lxml import etree text=''' 春晚个人简介姓名：岳云鹏住址：中国河南代表作：五环之歌 ''' #初始化 html=etree.HTML(text) # result=etree.tostring...
etree.HTML报错 python
2022-02-22 11:28

回答 1 已采纳代码发一下
想请教一下，为啥使用lxml.etree.HTML()，解析出来的是个空[ ],, python
2022-05-27 09:44

回答 2 已采纳先打印网页文本，看看有没有这个数据，没有就是反爬了！
PYTHON etree无法获得数据 python 爬虫
2021-08-27 14:40

回答 2 已采纳代码书写没问题，是你ps = tree.xpath('//head/text()')匹配的原因。
【python教程入门学习】用python3教你任意Html主内容提取
2021-10-12 14:27

燕山588的博客 from_encoding='utf-8') 6#查找所有的h4标签 7links = soup.find_all("h4") lxml: 1from lxml import etree 2# 假设html是需要被解析的html 3 4#将html传入etree 的构造方法,得到一个文档的对象 5root = etree.HTML...
Python无法使用xpath解析带命名空间的html标签 html python 爬虫
2022-04-13 10:57

回答 1 已采纳 xml.etree.ElementTree --- ElementTree XML API基本库了解一下解析带有命名空间的 XML 如果 XML 输入带有命名空间，则具有前缀的 prefix:s
关于Python爬虫的问题，etree库 python
2022-11-01 00:10

回答 2 已采纳 etree前面命名被覆盖了吧
python编码问题 pycharm python 爬虫
2022-04-30 20:03

回答 1 已采纳 https://www.yisu.com/zixun/322054.html参考一下
关于爬虫解析数据的4种方式
2021-11-22 11:08

米兔-miny的博客爬虫之解析数据的4种方式：XPath解析数据、BeautifulSoup解析数据、正则表达式、pyquery解析数据。
新版本lxml用不了etree.HTML怎么办 python
2022-09-08 15:27

回答 2 已采纳是这样用的呀： from lxml import etree html = etree.HTML(response.text) ret_list = html.xpath("xpath字符串")
python 请求url乱码问题处理
2022-01-20 14:22

白叔King的博客 response.encoding = 'gb2312' # 表示将gb2312编码的字符串str1转换成unicode编码。看完整代码 # coding=gb2312 import requests from lxml import etree if __name__ == '__main__': url = '...
Python中bs解析
2022-01-15 06:52

SteveKenny的博客文章目录简介安装本文示例的html代码用法实例化对象bs表达式四大对象种类TagNavigableStringBeautifulSoupComment搜索文档树find_allname 参数传字符串传正则表达式传列表传 True传方法attrs 参数text 参数limit ...
lxml解析器的使用
2020-05-31 23:49

路过的风666的博客 lxml lxml是一个HTML/XML的解析器，主要的功能是解析和提取HTML/XML数据。...2、解析html字符串，可以直接使用 lxml.etree.HTML 进行解析： # 解析已有html字符串 def parse_text(): # 默认为HTML解析器
requests模块爬取糗事百科用xpath解析
2022-03-02 06:00

晴泪的博客 x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36" } # 2，请求数据 response = requests.get(url=url,headers=headers).text # 3，解析数据 tree = etree.HTML(response) ...
数据分析从零开始实战，Pandas读写Excel/XML数据
2021-11-29 17:42

编程简单学的博客点击查看第一篇文章：数据分析从零开始实战，Pandas读取HTML页面+数据处理解析_ 点击查看第一篇文章：数据分析从零开始到实战，Pandas读写CSV数据_ 数据分析从零开始到实战，Pandas读写CSV数据 python入门到进阶...
Python爬虫开发学习全教程第二版，爆肝十万字【建议收藏】
2021-10-17 13:35

五包辣条！的博客常见的反爬手段和解决思路验证码处理 chrome浏览器使用方法介绍 JS的解析六、mongodb数据库 Mongodb的介绍和安装 mongodb的简单使用 Mongodb的的增删改查 mongodb的聚合操作 Mongodb的权限管理 mongodb和python...
python爬虫小结（-xpath解析）：（1）
2021-11-17 20:00

xiao52x的博客 # 一定要在循环内，否则一直为"https://pic.netbian.com/4kmeinv/index_2.html" # 关于为什么后面是/4kmeinv/index_{0}.html 代码后讲解 url = "https://pic.netbian.com/4kmeinv/index_{0}.html" url = url....
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日

悬赏问题

¥15 自适应 AR 模型参数估计Matlab程序
¥100 角动量包络面如何用MATLAB绘制
¥15 merge函数占用内存过大
¥15 Revit2020下载问题
¥15 使用EMD去噪处理RML2016数据集时候的原理
¥15 神经网络预测均方误差很小但是图像上看着差别太大
¥15 单片机无法进入HAL_TIM_PWM_PulseFinishedCallback回调函数
¥15 Oracle中如何从clob类型截取特定字符串后面的字符
¥15 想通过pywinauto自动电机应用程序按钮，但是找不到应用程序按钮信息
¥15 如何在炒股软件中，爬到我想看的日k线

etree解析html编码问题

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新