#requests-html 选择元素出现乱码(css选择或xpath选择均出现乱码,该网站的其他多数网页,正常不出现乱码),代码如下:
import pandas as pd
from requests_html import HTMLSession
session = HTMLSession()
session.encoding = 'utf-8'
url = 'http://ggzyjy.linyi.gov.cn/linyi/jyxx/012003/012003001/20170522/7119052f-0f87-481c-b77c-fe3f6e28f20c.html'
obj_t = session.get(url)
doc = obj_t.html.xpath("//div[@class='ewb-article-info']",first=True)#
doc1 = obj_t.html.find('div.ewb-article-info', first=True)
print(obj_t.html.text)#正常,无乱码
print(doc.text)#该处出现乱码
print(doc.html)#正常,无乱码
print(doc1.html)#正常,无乱码
print(doc1.text)#该处出现乱码
requests-html 选择元素出现乱码
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- CSDN专家-sinJack 2021-08-07 00:06关注
访问属性text时,会返回一个unicode对象,乱码问题就会常常发成在这里。
参考试试: https://blog.csdn.net/xc_zhou/article/details/80893315?utm_source=app&app_version=4.12.0 https://blog.csdn.net/xc_zhou/article/details/80893315?utm_source=app&app_version=4.12.0本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 目详情-五一模拟赛详情页
- ¥15 有了解d3和topogram.js库的吗?有偿请教
- ¥100 任意维数的K均值聚类
- ¥15 stamps做sbas-insar,时序沉降图怎么画
- ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
- ¥15 关于#Java#的问题,如何解决?
- ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
- ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
- ¥15 cmd cl 0x000007b
- ¥20 BAPI_PR_CHANGE how to add account assignment information for service line