selenium访问信用中国

用selenium访问信用中国，检索企业信用信息详情截图保存到word和下载企业信用报告，总是被拦截，求指导，感谢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

43条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-01-06 01:56
关注
获得0.80元问题酬金
上午好☀️☀️☀️️
本答案参考通义千问

要使用Selenium访问“信用中国”网站，并检索企业信用信息详情，然后将详情截图保存到Word文档以及下载企业信用报告，可能会遇到一些反爬虫机制。以下是一些可能的解决方案：

使用合适的浏览器驱动：

确保你使用的WebDriver版本与你的浏览器版本匹配。
定期更新WebDriver以确保兼容性。

模拟人类行为：

添加随机等待时间以避免被检测为自动化脚本。
使用ActionChains模拟鼠标移动和点击操作。

设置合理的User-Agent：

设置一个常见的User-Agent字符串，使请求看起来像是来自普通浏览器。

绕过验证码：

如果网站有验证码，可以尝试使用第三方验证码识别服务（如：2Captcha、Anti-Captcha）。
或者使用OCR技术来识别验证码。

使用代理IP：

使用代理IP池来避免频繁请求导致的IP被封禁。

处理弹窗和警告：

在执行操作前，确保关闭任何可能弹出的警告或弹窗。

保存截图到Word文档：

使用Python的python-docx库来创建Word文档并将图片插入其中。

下载文件：

设置WebDriver选项来自动下载文件，或者通过HTTP请求直接下载文件。

解决方案

步骤1: 安装必要的库

pip install selenium python-docx

步骤2: 编写代码

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.chrome.options import Options from docx import Document import time import os # 配置Chrome WebDriver chrome_options = Options() chrome_options.add_argument("--disable-notifications") chrome_options.add_experimental_option("prefs", { "download.default_directory": os.getcwd(), "download.prompt_for_download": False, "download.directory_upgrade": True, "safebrowsing.enabled": True }) driver = webdriver.Chrome(options=chrome_options) # 访问信用中国网站 driver.get("https://www.creditchina.gov.cn/") # 模拟输入企业名称并搜索 search_box = driver.find_element(By.ID, 'searchKey') search_box.send_keys('示例企业') # 替换为你要查询的企业名称 search_button = driver.find_element(By.XPATH, '//button[@class="btn btn-primary"]') search_button.click() # 等待页面加载完成 WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, '//div[@class="search-result-list"]/div'))) # 截图并保存到Word文档 time.sleep(2) # 防止页面未完全加载 driver.save_screenshot('screenshot.png') document = Document() document.add_picture('screenshot.png') document.save('credit_report.docx') # 下载企业信用报告 report_link = driver.find_element(By.XPATH, '//a[contains(text(), "信用报告")]') ActionChains(driver).move_to_element(report_link).click().perform() # 关闭浏览器 driver.quit()

注意事项

确保替换示例代码中的企业名称和其他元素选择器。
根据实际页面结构调整XPath表达式。
如果遇到验证码问题，可以考虑使用第三方服务或OCR工具。

希望这些步骤能够帮助你成功地使用Selenium访问“信用中国”网站，并完成所需的操作。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

selenium访问信用中国，如何实现？
2025-02-02 22:47

bug菌¹的博客问题描述用selenium访问信用中国，检索企业信用信息详情截图保存到word和下载企业信用报告，总是被拦截。解决方案如下是上述问题的解决方案，仅供参考：使用Selenium访问“信用中国”网站并执行检索操作，...
P1-测试理论
2024-07-22 15:24

lweiwei@的博客选择测试工具（excel）–确定测试场景（覆盖各种场景）–编写测试用例（包括测试用例名称、测试描述、预期结果、测试数据、步骤）–确认测试用例–组织测试用例。tar -cvf start.tar a.java b.java 当前目录下的a....
Python爬虫实战：基于最新技术爬取国家企业信用信息公示系统数据
2025-07-02 22:32

Python爬虫项目的博客本文将详细介绍如何使用Python最新技术栈构建一个高效、稳定的国家企业信用信息公示系统爬虫。我们将从爬虫基础知识讲起，逐步深入到反爬机制应对、数据解析与存储等高级话题，最终实现一个完整的爬虫系统。文章包含...
企查查爬虫python版本2022年
2022-11-23 12:57

企查查是一款在线的企业信用信息查询平台，提供包括企业工商信息、股东结构、法律诉讼、商标专利等在内的多种企业信息。本项目是一个基于Python的企查查网站爬虫，适用于2022年的数据抓取需求。以下是关于这个爬虫...
软件测试之保险
2022-11-23 20:19

波仔_搞IT的博客测试之保险项目
宇宙现场面试题目实录
2022-03-22 17:43

大白渡胖胖的博客看这篇软件测试培训_软件测试培训班_it培训_BI大数据_多测师 2.你觉得做自动化的意义在哪里 ==>需要对之前已经实现的功能进行回归测试、保证当前版本更新的内容不能影响到之前已经实现好的功能 3.你们做自动化...
自动化测试工具集成
2021-12-18 16:10

老姜一不小心的博客自动化测试工具集成
APP测试
2019-09-18 21:34

哭着哭着就萌了的博客仅仅从功能测试的层面上来讲的话，在流程和功能测试上是没有区别的。那么区别在哪里呢？我个人觉得就是由于载体不一样，所以系统测试和一些细节可能会不一样。那么我们就要先来了解，web和app的区别。 web项目...
APP测试基本流程
2018-02-28 09:54

嘿呦小黑的博客单纯从功能测试的层面上来讲的话，APP 测试、web 测试在流程和功能测试上是没有区别的。根据两者载体不一样，则区别如下：系统结构方面 web项目，b/s架构，基于浏览器的；web测试只要更新了服务器端，客户端就...
金融AI风险预警系统上线前必看：AI架构师总结的7个架构测试重点与避坑方法
2025-08-20 22:37

AI大模型应用工坊的博客本文将聚焦金融AI风险预警系统上线前的7个架构测试重点，涵盖数据可靠性、模型高可用、实时性能、合规性、异常鲁棒性、系统兼容性、监控自愈能力等关键维度。每个重点都会结合实际案例，说明“做什么”“为什么要做...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月6日

selenium访问信用中国

43条回答 默认 最新

解决方案

步骤1: 安装必要的库

步骤2: 编写代码

注意事项

问题事件

43条回答默认最新