叮咚小程 2023-01-25 08:46 采纳率: 100%
浏览 23
已结题

关于#Python爬虫#的问题

用下列代码进行网页爬取时报错

import lxml.html,requests
url ='https://www.python.org/dev/peps/pep-0020/'
xpath ='//*[@id="the-zen-of-python"]/pre/text()'
res = requests.get(url)
ht = lxml.html.fromstring(res.text)
text = ht.xpath(xpath)
print('Hello,\n'+''.join(text))

错误提示:RequestsDependencyWarning: urllib3 (2.0.0a3) or chardet (None)/charset_normalizer (2.0.12) doesn't match a supported version!
warnings.warn(

  • 写回答

3条回答 默认 最新

  • 「已注销」 2023-01-25 09:02
    关注

    您遇到的错误是由于 urllib3 库版本不匹配导致的。在这种情况下,您可以尝试升级或降级 urllib3 库的版本来解决问题。

    另外,在代码中使用 'requests' 和 'lxml' 两个库进行网络请求和解析网页信息。

    解决方案:

    升级urllib3库的版本,在终端输入pip install --upgrade urllib3,安装最新版本。

    如果想降低urllib3库的版本,在终端输入pip install urllib3==x.x.x,x.x.x为需要降低的版本号。

    也可以在请求网页时加入参数 verify=False,如 requests.get(url, verify=False)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 2月2日
  • 已采纳回答 1月25日
  • 创建了问题 1月25日

悬赏问题

  • ¥15 关于smbclient 库的使用
  • ¥15 微信小程序协议怎么写
  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画