使用 selenium 自动操作浏览器，如何避开 CloudFlare 5秒盾的检测

1、运行环境：Java + selenium + chrome浏览器108版本 + chromedriver

注：如果Java不能避开检测，也可以使用Python，只求正确方法

2、问题

公司业务：需要自动操作浏览器进行“登陆账号”和“商品库存数量的增加”

问题发生背景：selenium 自动操作浏览器访问 https://www.kickstarter.com/，会被 CloudFlare 检测到，特别在点击登陆之后

错误图片：

解答思路和尝试过的方法：

修改谷歌浏览器启动参数
更改访问ip

附代码


public static void main(String[] args) {
    WebDriver webDriver = null;
    try {
        // 设置 chromedirver 的存放位置
        System.getProperties().setProperty("webdriver.chrome.driver", CHROME_DRIVER);
        ChromeOptions chromeOptions = new ChromeOptions();
        //chrome添加参数
        addArguments(chromeOptions);
        // 实例化
        webDriver = new ChromeDriver(chromeOptions);
        // 1.模拟打开登陆页面
        webDriver.get(WEB_URL);

        /**
         * TODO:CloudFlare拦截有几种触发方式
         * 1、打开页面便会被检测 CloudFlare 到并拦截
         * 2、点击登陆或点击其他按钮跳转到其他页面都会被拦截
         */
        
        // 显式等待
        // 2.等10秒钟响应后再操作，不然内容可能还没有返回
        WebDriverWait wait = new WebDriverWait(webDriver, 10);
        // 查找id为“kw"的元素是否加载出来了（已经在页面DOM中存在）
        wait.until(ExpectedConditions.presenceOfElementLocated(By.id("user_session_email"))); // 在设定时间内找到后就返回，超时直接抛异常

        // ......

    } catch (Exception e) {
        e.printStackTrace();
        assert webDriver != null;
        File srcFile = ((TakesScreenshot)webDriver).getScreenshotAs(OutputType.FILE);
        //图片名称加时间戳
        String dateString = getDateFormat();
        // 需要指定图片的保存路径及文件名
        try {
            FileUtils.copyFile(srcFile, new File("D:\\selenium\\" + dateString + ".png"));
        } catch (IOException ioException) {
            ioException.printStackTrace();
        }
    } finally {
        if (webDriver != null) {
            webDriver.quit();
        }
    }
}

/**
 * chrome添加参数
 */
public static void addArguments(ChromeOptions options){
    // 不加载图片, 提升速度
    // 关闭界面上的---Chrome正在受到自动软件的控制
    options.addArguments("disable-infobars");
    // 浏览器不提供可视化页面. linux下不支持可视化不加这条会启动失败
    //options.addArguments("--headless");
    // 启动无沙盒模式运行，以最高权限运行
    options.addArguments("--no-sandbox");
    // 优化参数
    // 不加载图片, 提升速度
    options.addArguments("blink-settings=imagesEnabled=false");
    // 禁用gpu渲染
    options.addArguments("--disable-gpu");
    options.setExperimentalOption("excludeSwitches", new String[]{"enable-automation"});
    //设置为开发者模式
    options.addArguments("--disable-blink-features=AutomationControlled");
    options.addArguments("--user-agent=Mozilla/5.0 HAHA");
    //  隐藏滚动条, 应对一些特殊页面
    options.addArguments("--hide-scrollbars");
    // 优化参数
    // 指定用户文件夹User Data路径，可以把书签这样的用户数据保存在系统分区以外的分区
    options.addArguments("--user-data-dir=D:\\selenium\\ChromeProfile");
    //chrome.exe --remote-debugging-port=9333 --user-data-dir="D:\selenium\ChromeProfile"
    //options.setExperimentalOption("debuggerAddress", "127.0.0.1:9333");

    //设置访问的ip
    options.addArguments("--proxy-server=http://36.26.106.179:4223");

}

展开全部

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

8条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-02-25 12:41
关注
建议你看下这篇博客👉 ：Selenium自动化绕过Cloudflare检测的方法
解决 1
无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

如何使用 Python 和 Selenium 解决 Cloudflare 验证码
2024-08-27 11:50

朱公子的Note的博客然而，当遇到Cloudflare验证码时，传统的自动化脚本往往会被阻挡。...解决Cloudflare验证码并非易事，但通过合理使用Python和Selenium中的各种技术和工具，开发者可以有效降低验证码的干扰，为自动化操作铺平道路。
使用selenium框架的Python爬虫被检测到的解决方法
2020-04-16 07:30

Python新世界的博客本人之前在做X宝，X评，X团的爬虫项目时，均遇到了获取cookies这个重要的问题，而获取cookies的前提是实现用户登录，登陆的过程就不...那我们的思考路线就是如何让这个js文件功能作废，本人使用的方法是通过 mitmp...
如何绕过Cloudflare？
2023-05-30 01:14

穿云API-cloudbypass的博客通过使用无头浏览器，您可以更好地模拟真实用户的行为，绕过Cloudflare的检测。网站上的内容根据所使用的浏览器而有所不同。这样，您就可以获得与使用传统爬虫工具不同的访问权限，从而绕过Cloudflare的检测。需要...
使用 Python 和 Selenium 解决 hCaptcha：完整指南
2024-11-13 07:24

ForRunner123的博客在我们深入探讨如何解决 hCaptcha 之前，让我们快速了解一下 hCaptcha 到底是什么。本质上，hCaptcha 是一种 CAPTCHA（完全自动化的公共...这是因为越来越多的网站使用 hCaptcha，尤其是那些依赖于阻止机器人的网站。
Scrapy对比Selenium：哪个最适合您的网络爬虫项目
2025-03-29 01:15

守城小轩的博客 Selenium是一个开源的Web自动化工具，允许用户以编程方式控制Web浏览器。虽然它主要用于测试Web应用程序，但由于其能够与重度JavaScript网站交互，在Web爬虫领域也广受欢迎，这些网站使用传统方法难以爬取。需要注意...
Python 网络数据采集（四）：Selenium 自动化
2024-01-12 07:21

半点闲的博客在 WEB 功能测试领域，Selenium 是一个免费、开源、跨平台的重要工具，它可以对 Chrome、Firefox、Safari 等浏览器进行测试，支持多种语言（如 Python、Java、C#、Ruby、JavaScript 等），它足以胜任一切 WEB 功能...
2023 年如何绕过 Cloudflare
2023-11-09 02:58

aini123152008的博客 Cloudflare|5秒盾
selenium工作原理和反爬分析
2023-10-27 05:44

骇客567的博客 Selenium通过使用特定于每种语言的驱动程序支持各种编程语言。Selenium支持的语言包括C#，Java，Perl，PHP，Python和Ruby。Selenium支持的浏览器包括Internet Explorer，Mozilla Firefox，Google Chrome和Safari。
爬虫教程（ 5 ） --- Selenium、PhantomJS、selenium反检测、cdp ( ichrome )、Playwright、DrissionPage、helium
2020-08-31 16:47

擒贼先擒王的博客 Selenium、PhantomJS、selenium反检测、cdp ( ichrome )、Playwright、DrissionPage
使用selenium和undetected_chromedriver报错urllib.error.HTTPError: HTTP Error 404: Not Found的一劳永逸解决办法
2024-05-24 10:01

小小爬虾的博客有时使用selenium和seleniumbase访问部分网站的时候，需要使用代理。主要问题就是undetected_chromedriver和chrome浏览器的适配问题，下面这篇文章说的一针见血，就是undetected_chromedriver不会自动更新，导致今天...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月25日

使用 selenium 自动操作浏览器，如何避开 CloudFlare 5秒盾的检测

1、运行环境：Java + selenium + chrome浏览器108版本 + chromedriver

注：如果Java不能避开检测，也可以使用Python，只求正确方法

2、问题

公司业务：需要自动操作浏览器进行“登陆账号”和“商品库存数量的增加”

问题发生背景：selenium 自动操作浏览器访问 https://www.kickstarter.com/，会被 CloudFlare 检测到，特别在点击登陆之后

错误图片：

解答思路和尝试过的方法：

附代码

8条回答 默认 最新

问题事件

8条回答默认最新