爬虫的ip代理设置问题

import requests
url = "http://www.baidu.com/"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 '
                  'Safari/537.36'
}
proxies = {
    'http': '37.120.165.19:8000',
    'https': '37.120.165.19:8000'
}
if __name__ == '__main__':
    response = requests.get(url, headers=headers, proxies=proxies, timeout=5)
    print(response.text)

我得到的内容并不是百度的？这是咋回事？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
百科新知 2023-04-06 08:59
关注
引用新必应
根据您提供的代码，可能是代理IP出现了问题导致获取到的内容不是百度的。可能的原因有以下几个：

代理IP失效或过期。如果您使用的代理IP已经失效或过期，可能会导致请求被重定向到其他网站，从而得到不是预期的内容。

IP地址被封或黑名单。如果您使用的代理IP被目标网站封禁或加入了黑名单，可能会导致请求被拒绝或重定向到其他页面。

代理设置错误。如果您对代理设置存在错误，例如IP地址或端口号填写错误，可能会导致请求被无法连接或重定向到其他网站。

为了排除这些可能的问题，您可以进行以下尝试：

更换代理IP。您可以更换一个可用的代理IP，确保其能够正常连接目标网站，并且没有被封禁或加入黑名单。

打印请求的响应状态码。在请求后，您可以通过查看响应的状态码，来判断是否存在请求被重定向或被拒绝等情况。可以通过response.status_code的方式来打印状态码，并根据状态码进行调试。

检查代理设置。可以再次检查代理IP的设置信息是否正确，包括IP地址和端口号等信息。

除此之外，如果您的代理IP是付费使用的，建议联系代理IP提供商寻求帮助，以确保能够正常使用代理IP。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

爬虫的ip代理设置问题 python 爬虫
2023-04-06 07:18

回答 4 已采纳引用新必应根据您提供的代码，可能是代理IP出现了问题导致获取到的内容不是百度的。可能的原因有以下几个：代理IP失效或过期。如果您使用的代理IP已经失效或过期，可能会导致请求被重定向到其他网站，从而得
【Python】爬虫Ip代理问题 python
2021-09-06 17:15

回答 4 已采纳那你至少需要研究一下多线程的技术，否则你主线程已经阻塞住了，写什么代码也不执行啊
爬虫怎么使用代理ip html5 python 开发语言
2022-07-03 19:47

回答 2 已采纳直接上代码，有报错的话可以自行调试一下，逻辑很简单不难的： import requests from selenium import webdriver def conc_ip(url):
《Python 常用技能》爬虫入门必备—IP代理 的优势与使用方法
2022-04-19 09:00

呆呆敲代码的小Y的博客动态代理ip 相信大家肯定都听说过，或者已经使用过。本篇文章就来介绍一下什么是动态代理ip，以及简单的使用方法。使用动态ip有很多好处，比如保护你的网络免受外部攻击、屏蔽你的IP地址等。那本篇文章就来研究...
python爬虫如何设置代理IP python 网络网络协议
2022-05-07 09:18

回答 2 已采纳 request中的参数proxies
关于爬虫使用代理之后仍显示本机IP的问题多彩生活
2021-03-05 19:58

回答 1 已采纳代理写错了，试试这样写 proxy = { 'http': 'http://36.7.252.125:45113' }
python 爬虫使用代理 ip 访问网站遇到的问题 python
2021-03-28 15:50

回答 2 已采纳把https://去掉试一下看： PROXY = "111...：4221" chrome_opt = WebDriver.ChromeOptions() chrome_opt.add_argume
高效稳定爬虫：Python技巧大揭秘.zip知识领域：Python网络爬虫开发技术关键词：多线程、异步编程、请求头设置、协程、
2024-03-07 17:23

技术关键词：多线程、异步编程、请求头设置、协程、分布式爬虫内容关键词：效率提升、稳定性增强、异常处理、IP代理池、代码优化用途：提高数据抓取速度，保证长期稳定运行，适用于各种数据采集场景。
python多线程下载+IP代理问题 python 爬虫
2023-02-08 13:16

回答 3 已采纳十分感谢，我已经解决问题了，原因是部分ip代理无效导致下载的文件损坏
python爬虫代理服务器如何设置 python
2023-03-07 10:15

回答 1 已采纳在Python爬虫中使用代理服务器可以通过设置urllib或requests的proxies参数来实现。下面是一个使用代理服务器的示例代码： import requests proxy = {
【Python爬虫】Ip爬取问题 python
2021-09-09 14:53

回答 4 已采纳使用try catch维护,发现疑似失效ip就给个对应标记,标记达到一定数量就删除对应ip
Python爬虫库框架学习及Python高度匿名代理IP
2023-04-06 11:15

那么学习爬虫需要掌握哪些库呢通用： 1.urllib -网络库(stdlib)。 2.requests -网络库。 3.grab – 网络库（基于pycurl）。 4.pycurl – 网络库（绑定libcurl）。 5.urllib3 – Python HTTP库，安全连接池、支持...
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
Python爬虫Scrapy框架IP代理的配置与调试
2020-05-18 13:30

Python新世界的博客怎么确定是代理ip的问题呢？由于笔者主修语言是Java，所以有些解释可能和Python大佬们的解释不一样，因为我是从Java 的角度看Python。这样也便于Java开发人员阅读理解。代理ip的逻辑在哪里一个scrapy 的项目...
自建代理IP池管理系统
2021-06-10 21:01

数据时代，数据最贵，爬虫是最需要掌握的技术之一，代理IP则是爬虫最大的代价。自建代理IP池管理系统，自己来掌控代理IP，物尽其用，节约成本，还可以抓取公开、免费的代理IP放入系统中，供自己使用。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月6日

悬赏问题

¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法

爬虫的ip代理设置问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新