Baxy2021 2024-04-28 22:25 采纳率: 100%
浏览 84
已结题

浏览器能正常访问的URL,使用爬虫访问报错:'Connection aborted.', ConnectionResetError(10054, '远程主机强迫关闭了一个现有的连接。',

浏览器能正常访问的URL,使用爬虫访问(不是频繁请求,就单次运行请求)直接报错:“requests.exceptions.ConnectionError: ('Connection aborted.', ConnectionResetError(10054, '远程主机强迫关闭了一个现有的连接。', None, 10054, None))


import requests
session = requests.session()
headerss = {
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7',
    'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6',
    'Connection': 'keep-alive',
    'Sec-Fetch-Dest': 'document',
    'Sec-Fetch-Mode': 'navigate',
    'Sec-Fetch-Site': 'none',
    'Sec-Fetch-User': '?1',
    'Upgrade-Insecure-Requests': '1',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0',
    'sec-ch-ua': '"Chromium";v="124", "Microsoft Edge";v="124", "Not-A.Brand";v="99"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}
response = session.get('https://fdrfw....xyz/ui/comics/main', headers=headerss,timeout=20 ,verify=False)
print(response.status_code)

该域名下的所有get,post请求都是无响应,但是浏览器都能正常访问,试过的解决方案都不行,比如:随机User-Agent,代理IP,更换新电脑(不同网络),手机运行代码都是无响应直接报错!因为URL有些违规,所以做了删减一些字符处理,就像问下有遇到这情况的网友是有什么解决思路吗?

img

  • 写回答

2条回答 默认 最新

  • 百锦再@新空间代码工作室 全栈领域优质创作者 2024-04-28 22:31
    关注

    import requests 
    session = requests.session()headerss = {'Accept': 'text/html,application/xhtml+xml,application/xml;
    q=0.9,image/avif,image/webp,image/apng,*/*;
    q=0.8,application/signed-exchange;
    v=b3;
    q=0.7','Accept-Language': 'zh-CN,zh;
    q=0.9,en;
    q=0.8,en-GB;
    q=0.7,en-US;
    q=0.6','Connection': 'keep-alive','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'none','Sec-Fetch-User': '?1','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 10.0;
    Win64;
    x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0','sec-ch-ua': '"
    Chromium"
    ;
    v="
    124"
    , "
    Microsoft Edge"
    ;
    v="
    124"
    , "
    Not-A.Brand"
    ;
    v="
    99"
    ','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"
    Windows"
    '}
    response = session.get('https://fdrfw....xyz/ui/comics/main', headers=headerss, verify=False, timeout=20)print(response.status_code)

    如果尝试过随机User-Agent、代理IP、更换网络、手机运行代码等方法都不起作用,那可能是因为该网站采取了更严格的反爬措施,导致无法通过代码访问。可能的解决思路包括:

    1. 进行更深入的分析:尝试查看网站的具体反爬措施,了解是否有其他限制因素,如js动态加载、验证码等。

    2. 使用模拟浏览器:可以考虑使用Selenium等工具模拟浏览器行为,以绕过网站的反爬机制。

    3. 联系网站所有者:有时候,向网站所有者请求权限或合作可能是解决问题的更有效途径。

    4. 考虑法律风险:最后,需要谨慎对待绕过网站反爬措施的行为,避免触犯法律或侵犯他人权益。


    有问题你别着急,评论留言都可以,看到马上就回复,尽量及时补充齐
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月28日
  • 已采纳回答 4月28日
  • 创建了问题 4月28日

悬赏问题

  • ¥15 clousx6整点报时指令怎么写
  • ¥30 远程帮我安装软件及库文件
  • ¥15 关于#自动化#的问题:如何通过电脑控制多相机同步拍照或摄影(相机或者摄影模组数量大于60),并将所有采集的照片或视频以一定编码规则存放至规定电脑文件夹内
  • ¥20 深信服vpn-2050这台设备如何配置才能成功联网?
  • ¥15 Arduino的wifi连接,如何关闭低功耗模式?
  • ¥15 Android studio 无法定位adb是什么问题?
  • ¥15 C#连接不上服务器,
  • ¥15 angular项目错误
  • ¥20 需要帮我远程操控一下,运行一下我的那个代码,我觉得我无能为力了
  • ¥20 有偿:在ubuntu上安装arduino以及其常用库文件。