weixin_43123001 2021-08-06 23:34 采纳率: 100%
浏览 113
已结题

requests-html 选择元素出现乱码


#requests-html 选择元素出现乱码(css选择或xpath选择均出现乱码,该网站的其他多数网页,正常不出现乱码),代码如下:

import pandas as pd
from requests_html import HTMLSession

session = HTMLSession()
session.encoding = 'utf-8'
url = 'http://ggzyjy.linyi.gov.cn/linyi/jyxx/012003/012003001/20170522/7119052f-0f87-481c-b77c-fe3f6e28f20c.html'
obj_t = session.get(url)

doc = obj_t.html.xpath("//div[@class='ewb-article-info']",first=True)#
doc1 = obj_t.html.find('div.ewb-article-info', first=True)

print(obj_t.html.text)#正常,无乱码
print(doc.text)#该处出现乱码
print(doc.html)#正常,无乱码
print(doc1.html)#正常,无乱码
print(doc1.text)#该处出现乱码



  • 写回答

2条回答 默认 最新

查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月15日
  • 已采纳回答 8月7日
  • 创建了问题 8月6日

悬赏问题

  • ¥15 对于知识的学以致用的解释
  • ¥50 三种调度算法报错 有实例
  • ¥15 关于#python#的问题,请各位专家解答!
  • ¥200 询问:python实现大地主题正反算的程序设计,有偿
  • ¥15 smptlib使用465端口发送邮件失败
  • ¥200 总是报错,能帮助用python实现程序实现高斯正反算吗?有偿
  • ¥15 对于squad数据集的基于bert模型的微调
  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存
  • ¥15 CST保存项目时失败