人机验证通过后跳转目标页面，无法获取到目标页面内容

selenium 驱动chrome抓取一个网站数据，有cloudflare的人机校验；浏览器打开后不关闭，人机校验通过后，页面跳转到了目标页面。但是chrome.pagesource获取不到目标页面内容，得到的还是人机校验界面的内容。

目标网站：https://www.munpia.com/
我的代码：

    options = webdriver.ChromeOptions()
    # 设置参数
    # 浏览器打开不关
    options.add_experimental_option("detach", True)
    options.add_experimental_option("excludeSwitches", ["enable-automation"])
    options.add_experimental_option('useAutomationExtension', False)
    chrome = webdriver.Chrome(options=options)
    chrome.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
        "source": """
            # 这里的操作大概就是把控制台中的window.navigator.webdriver =undefined  赋值   因为人机操作会认为是Ture
            Object.defineProperty(navigator, 'webdriver', {
              get: () => undefined
            })
          """
    })

    chrome.get(source_url)
    time.sleep(5)  # 这里可能需要根据实际情况调整等待时间

    iframe_element = chrome.find_element(By.XPATH,"//iframe[@title='包含  Cloudflare  安全质询的小组件 ']")
    # 切换到iframe中
    chrome.switch_to.frame(iframe_element)
    click_element = chrome.find_element(By.CSS_SELECTOR, "input[type='checkbox']")
    actions = ActionChains(chrome)
    actions.move_to_element(click_element).perform()
    actions.click(click_element).perform()
    WebDriverWait(chrome, 20).until_not(EC.presence_of_element_located((By.XPATH, "//iframe[@title='包含 Cloudflare 安全质询的小组件 ']")))
    chrome.switch_to.default_content()
    WebDriverWait(chrome, 60).until(expected_conditions.url_contains('munpia.com'))
    print(chrome.page_source)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-22 12:54

关注

引自免费微信小程序：皆我百晓生

在您的代码中，看起来您已经正确地处理了Cloudflare的反自动化检测，并且成功地通过了人机验证。然而，chrome.page_source 获取的是整个浏览器窗口的源代码，包括可能存在的多个iframe。因此，即使页面已经跳转，您仍然可能看到之前的人机验证界面。

为了解决这个问题，您可以尝试在等待URL变化之后再次获取页面源码。这样可以确保您获取的是最终目标页面的源代码。以下是修改后的代码：

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.action_chains import ActionChains

# 创建Chrome选项
options = webdriver.ChromeOptions()
# 设置参数
# 浏览器打开不关
options.add_experimental_option("detach", True)
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)

# 添加用户代理以模仿真实用户行为（可选）
options.add_argument('--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3')

# 初始化Chrome驱动
chrome = webdriver.Chrome(options=options)

# 执行脚本绕过Cloudflare的检测
chrome.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """
        # 这里的操作大概就是把控制台中的window.navigator.webdriver =undefined  赋值   因为人机操作会认为是Ture
        Object.defineProperty(navigator, 'webdriver', {
          get: () => undefined
        })
      """
})

# 访问源网址
chrome.get("https://www.munpia.com/")

# 等待页面加载完成
WebDriverWait(chrome, 10).until(EC.presence_of_element_located((By.TAG_NAME, "body")))

# 处理Cloudflare验证
iframe_element = chrome.find_element(By.XPATH, "//iframe[@title='包含  Cloudflare  安全质询的小组件 ']")
# 切换到iframe中
chrome.switch_to.frame(iframe_element)
click_element = chrome.find_element(By.CSS_SELECTOR, "input[type='checkbox']")
actions = ActionChains(chrome)
actions.move_to_element(click_element).perform()
actions.click(click_element).perform()
WebDriverWait(chrome, 20).until_not(EC.presence_of_element_located((By.XPATH, "//iframe[@title='包含 Cloudflare 安全质询的小组件 ']")))
chrome.switch_to.default_content()

# 等待目标页面加载
WebDriverWait(chrome, 60).until(expected_conditions.url_contains('munpia.com'))

# 在URL变化后再获取页面源码
target_page_source = chrome.page_source

print(target_page_source)

# 关闭浏览器
chrome.quit()

这个版本的代码增加了对整个页面加载的等待，然后在URL变化后再次获取页面源码。这样应该能确保您获取到的是目标页面的源代码。如果还有问题，请检查网络请求是否正常，或者确认是否有其他安全措施阻止了爬虫访问。

编辑记录

报告相同问题？

关注问题

安全检测GO内外链跳转页面html源码
2022-04-16 20:07

在安全检测中，内外链跳转页面可以作为一道屏障，对访问者进行人机验证，防止爬虫、机器人或其他恶意程序对网站造成伤害。描述中提到的“清新好看的跳转源码”意味着这个源代码设计得既美观又实用。源码是网页的...
Python爬虫突破人机验证的语音识别解决方案.pdf
2025-04-20 15:41

文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿...
基于PHP的炫酷黑色网址安全跳转GO跳转PHP源码.zip
2023-08-29 00:23

在互联网应用中，这种跳转功能通常用于网站维护、页面重定向、URL短链服务或者防止恶意链接的传播。通过源码学习，我们可以深入了解PHP在处理URL跳转时的技术细节和安全措施。【描述】"基于PHP的炫酷黑色网址安全...
AutoGPT目标设定技巧：如何给出高效的高级指令
2025-12-15 02:47

已退乎的博客本文探讨如何通过结构化指令提升AutoGPT的执行效率，分析模糊目标与高效目标的差异，提出抽象层级适中、明确输出格式、可衡量标准和减少歧义四大关键特征，并介绍目标增强模块的设计思路，帮助用户实现从意图到自动...
一款清新好看的跳转源码
2023-12-22 15:15

这种跳转方式常用于网站维护、更新期间的临时替代页面，或是作为验证码或人机验证的过渡页。在描述中提到的“底部自行更换跳转目标地址”，意味着这个源码允许开发者或使用者自行修改HTML文件中的链接，以设置他们...
Qwen3-VL支持多种编程语言输出：Python、Java、C#一键生成
2026-01-03 04:23

han Lee的博客通义千问推出的Qwen3-VL模型实现了从界面截图直接生成可执行代码的突破，融合多模态理解与程序合成技术，支持Python、Java、C#等语言，显著提升开发与自动化效率，推动人机协作进入新阶段。
技术开发：从人类主导到人机共生的范式革命
2025-05-08 09:41

hongdou199的博客技术开发行业正在经历从 "人类主导" 到 "人机共生" 的范式革命。当 AI 能够自动生成 80% 的代码，人类将专注于需求定义、价值判断和创新设计。这种协作模式不仅提升效率，更催生了 "AI 训练师"" 提示工程师 " 等新...
最新YOLO实现的机场航拍小目标实时检测平台（Flask+SocketIO+HTML/CSS/JS）
2025-12-21 16:47

逗逗班学Python的博客面向机场航拍小目标实时检测，本文实现基于 Flask + Flask-SocketIO/HTML/CSS/JS 的网页平台，支持图片、视频与浏览器摄像头输入；提供左右双画面对比、进度控制、阈值与类别筛选、CSV 导出与带框结果一键下载；检测...
MIT团队推出NIGHTJAR系统：让自然语言和代码实现共享状态
2025-12-23 21:00

至顶头条的博客 MIT团队推出NIGHTJAR系统：让自然语言和代码实现共享状态
从氛围编程到端到端内容创作：我踩过的 AI 协同深坑与心得
2025-09-22 00:08

nkwshuyi的博客诚然即便在快速变化的环境里，每个人也可能因为自己的积累都有引以为傲的「相对静态常量」—— 包括你建立的信誉、你的投资和储蓄，你的人脉圈……用户对内容的控制、AI 对任务的理解，以及全自动生成，这几者之间...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

人机验证通过后跳转目标页面，无法获取到目标页面内容

7条回答 默认 最新

问题事件

7条回答默认最新