laomu0515 2022-08-22 19:48 采纳率: 100%
浏览 13
已结题

etree解析html编码问题

python 用etree 解析html文件 出来 是一个地址 :

代码:

    response = requests.get(Url, headers=Headers)
    response.encoding = 'utf-8'
    html = etree.HTML(response.text)
    print(html)
    print(type(html))

结果

<Element html at 0x1e797aa8cc0>
<class 'lxml.etree._Element'>

以下方法都试过无效

    res = requests.get(url)
    html = etree.HTML(res.content )
    res = requests.get(url)
    html_text = bytes(bytearray(res.text, encoding='utf-8'))
    html = etree.HTML(html_text)

print response.text 是有内容的,网页也是 utf 8编码, etree 解析之后就返回一个元素地址,哪里出了问题?

  • 写回答

2条回答 默认 最新

  • honestman_ 2022-08-22 20:22
    关注

    没有问题,这是一个html对象,后续直接可以调用xpath方法定位元素就行

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月31日
  • 已采纳回答 8月23日
  • 创建了问题 8月22日

悬赏问题

  • ¥15 自适应 AR 模型 参数估计Matlab程序
  • ¥100 角动量包络面如何用MATLAB绘制
  • ¥15 merge函数占用内存过大
  • ¥15 Revit2020下载问题
  • ¥15 使用EMD去噪处理RML2016数据集时候的原理
  • ¥15 神经网络预测均方误差很小 但是图像上看着差别太大
  • ¥15 单片机无法进入HAL_TIM_PWM_PulseFinishedCallback回调函数
  • ¥15 Oracle中如何从clob类型截取特定字符串后面的字符
  • ¥15 想通过pywinauto自动电机应用程序按钮,但是找不到应用程序按钮信息
  • ¥15 如何在炒股软件中,爬到我想看的日k线