Python爬虫配合VPN爬取出现报错


```python

def get_url():
    url_list = []
    for a in range(1,3): #页数
        url = 'xxxxx/page/{}/'.format(a)
        html = requests.get(url,headers=headers).text
        soup = BeautifulSoup(html, 'lxml')
        soup = soup.find_all('div', class_='gridhub-posts gridhub-posts-grid')[0]
        for i in range(0,10): 
            data = soup.find_all('div',class_= 'gridhub-grid-post gridhub-5-col')[i]
            url = data.find_all('a',class_= 'gridhub-grid-post-thumbnail-link')[0].get('href')
            url = url + '1/'
            if len(url)>6 and url not in url_list:
                url_list.append(url)
            else:
                pass
    print('页数数据获取完毕')
    return url_list

```

运行结果及报错内容

```显示如下报错：
urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='xx', port=443): Max retries exceeded with url: xxx (Caused by SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1124)')))

requests.exceptions.SSLError: HTTPSConnectionPool(host='xxx', port=443): Max retries exceeded with url:xxx (Caused by SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1124)')))

我的解答思路和尝试过的方法

{pip install cryptography
pip install pyOpenSSL
pip install certifi -- 无效}

我想要达到的结果

若关闭VPN爬取其他网站（国内）就无报错？
如何解决VPN配合爬虫报错的问题？百度之后给予的方案(如下)无效

展开全部

写回答
好问题 2 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星空下0516 2021-12-22 11:23
关注
你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

python爬虫动态网页爬取报错 python 爬虫
2022-11-22 15:06

回答 2 已采纳 news 数据获取错误 import requests import json url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairs
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 03:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python爬虫的图片爬取 python 爬虫
2021-08-30 04:26

回答 2 已采纳按照下图这样就可以了
Python-数据爬取（爬虫）
2024-07-12 09:01

.房东的猫的博客定义：深度优先搜索是一种遍历或搜索树或图的算法，从起始节点开始，一直沿着一个分支走到底，再回溯到上一个节点继续搜索下一个分支，...在大规模数据爬取时，选择合适的存储方式取决于数据的规模、结构和访问需求。
python爬取图片报错TypeError python 爬虫
2022-12-29 15:52

回答 1 已采纳你这是没有爬到，数据为空的才报的错。可以使用异常处理try一下，再处理为空的情况
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 11:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
python爬图片，代码没报错但是没有结果 python
2022-06-28 21:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
python 爬虫，挂VPN后，requests报错
2023-05-31 06:27

YIruizZ的博客 2. 在开启vpn的插件中添加白名单(添加接口的域名或者ping一下获得ip和端口号),然后重新启动一下vpn.爬取国外某网站数据，然后向国内服务器提交爬取的数据。1.在requests请求接口提交数据时，挂上代理。
python爬虫初学，运行不报错但是没有结果？ python 有问必答
2021-04-01 08:51

回答 4 已采纳代码问题：1.request少写了s。 2. fillUnivList(ulist,html)函数没有return。 3.printUnivList(ulist,num)缺少异常处理。 4
【Python爬虫】Ip爬取问题 python
2021-09-09 06:53

回答 4 已采纳使用try catch维护,发现疑似失效ip就给个对应标记,标记达到一定数量就删除对应ip
python爬虫如何只爬取标签内容 python
2019-04-28 03:24

回答 1 已采纳用 for key in ee.keys(): print（key）就行啦
python 爬虫使用代理爬取
2019-05-02 10:00

Lancer_Wu的博客之前有需要翻墙爬取内容，发现需要使用代理，不能简单的在requests里加个参数就行了，现在把脚本改成通用模板，有需要的可以按照自己的需求改一下哈。 import urllib.request as request import requests import ...
问题-python-爬虫无法爬取外网资源问题（python爬虫）
2024-06-24 03:46

篝火囚徒的博客后续了解具体原理了，我会在这篇文章上更新具体分析——这个报错通过关掉梯子就能解决，目前不清楚具体原理。也可以把这个东西打开，但是用完建议关掉。
使用python爬虫爬取热门文章分析最新技术趋势
2024-10-29 09:57

I'mAlex的博客本文借助爬虫来分析哪些技术正在快速发展，哪些问题在开发者中引起广泛讨论，从而为学习和研究提供重要参考。
记一次用Python爬取代理IP并使用
2021-01-21 08:50

我这边是找到了一个平台：https://www.kuaidaili.com/，先在地址后面加robots.txt查看平台的robots协议（https://www.kuaidaili.com/robots.txt）如下，可以看到平台未明令禁止爬虫爬取的页面，那我们就可以放心爬了...
没有解决我的问题, 去提问