gky___ 2023-04-06 07:18 采纳率: 100%
浏览 17
已结题

爬虫的ip代理设置问题

import requests
url = "http://www.baidu.com/"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 '
                  'Safari/537.36'
}
proxies = {
    'http': '37.120.165.19:8000',
    'https': '37.120.165.19:8000'
}
if __name__ == '__main__':
    response = requests.get(url, headers=headers, proxies=proxies, timeout=5)
    print(response.text)

我得到的内容并不是百度的?这是咋回事?

  • 写回答

4条回答 默认 最新

  • 百科新知 2023-04-06 08:59
    关注

    引用新必应
    根据您提供的代码,可能是代理IP出现了问题导致获取到的内容不是百度的。可能的原因有以下几个:

    1. 代理IP失效或过期。如果您使用的代理IP已经失效或过期,可能会导致请求被重定向到其他网站,从而得到不是预期的内容。

    2. IP地址被封或黑名单。如果您使用的代理IP被目标网站封禁或加入了黑名单,可能会导致请求被拒绝或重定向到其他页面。

    3. 代理设置错误。如果您对代理设置存在错误,例如IP地址或端口号填写错误,可能会导致请求被无法连接或重定向到其他网站。

    为了排除这些可能的问题,您可以进行以下尝试:

    1. 更换代理IP。您可以更换一个可用的代理IP,确保其能够正常连接目标网站,并且没有被封禁或加入黑名单。

    2. 打印请求的响应状态码。在请求后,您可以通过查看响应的状态码,来判断是否存在请求被重定向或被拒绝等情况。可以通过response.status_code的方式来打印状态码,并根据状态码进行调试。

    3. 检查代理设置。可以再次检查代理IP的设置信息是否正确,包括IP地址和端口号等信息。

    除此之外,如果您的代理IP是付费使用的,建议联系代理IP提供商寻求帮助,以确保能够正常使用代理IP。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 4月14日
  • 已采纳回答 4月6日
  • 创建了问题 4月6日

悬赏问题

  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法