python从巨潮资讯网批量下载指定范围年报

可以帮我看看为什么运行不了吗？
想要实现的目的：根据企业代码.xlxs里的企业名单在巨潮资讯网搜索2023年年度报告并下载
代码：

import os
import time
from selenium import webdriver # type: ignore
from selenium.webdriver.common.keys import Keys # type: ignore
from openpyxl import load_workbook # type: ignore
from selenium.webdriver.chrome.service import Service  # type: ignore
# 读取企业代码
def read_company_codes(file_path):
    wb = load_workbook(file_path)
    ws = wb.active
    company_codes = []
    for row in ws.iter_rows(min_row=2, values_only=True):
        company_codes.append((row[0], row[1]))
    return company_codes

# 下载年报
def download_annual_reports(company_codes):
    service = Service('C:\Program Files\ESBrowser\chromedriver.exe')  
    driver = webdriver.Chrome(service=service)
    driver.get("http://www.cninfo.com.cn/new/index")

    for code, name in company_codes:
        # 搜索年报
        search_box = driver.find_element_by_id("searchKeyword")
        search_box.clear()
        search_box.send_keys(code)
        search_box.send_keys(Keys.ENTER)

        # 选择分类-年报
        annual_reports_link = driver.find_element_by_xpath("//a[contains(text(), '年报')]")
        annual_reports_link.click()

        # 下载年报
        download_button = driver.find_element_by_xpath("//a[contains(text(), '下载')]")
        download_button.click()

        # 等待下载完成
        time.sleep(5)

        # 重命名文件
        old_file_path = "D:\\数据采集\\年报\\" + code + ".pdf"
        new_file_path = "D:\\数据采集\\年报\\" + code + "_" + name + ".pdf"
        os.rename(old_file_path, new_file_path)

    driver.quit()

配置环境：pyhton3.11.9 64bit
1.

2.企业代码.xlxs的数据结构

3.selenium.库

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-06-06 08:31
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

根据您提供的信息和代码，我将帮助您逐步排查可能的问题：

1. 环境配置

Python版本：您使用的是Python 3.11.9 64位，这与selenium库的版本4.21.0兼容。
Chromedriver和Chrome浏览器：您已确认chromedriver版本与Chrome浏览器版本匹配，这是正确的步骤。

2. 文件路径

chromedriver路径：C:\Program Files\ESBrowser\chromedriver.exe 路径看起来是正确的，但请确保该路径下确实存在chromedriver.exe文件。

3. 企业代码数据

数据结构：根据您提供的截图，企业代码和名称似乎是以两列的形式存储在Excel文件中，这与您的代码逻辑相匹配。

4. 代码逻辑

读取Excel文件：使用openpyxl库读取Excel文件的逻辑看起来是正确的。
Selenium操作：您的代码中使用selenium打开浏览器、搜索年报、点击下载和重命名文件的逻辑也是正确的。

5. 错误排查

网络连接：请确保您的网络连接正常，并且可以访问巨潮资讯网。
Selenium控制Chrome：尝试运行一个简单的selenium脚本，比如打开一个网页，以确保selenium可以控制Chrome浏览器。
XPath选择器：请检查XPath选择器是否正确。您可以通过在浏览器中使用开发者工具来验证XPath。
文件下载和重命名：确保下载路径D:\\数据采集\\年报\\存在，并且您的用户账户有写入权限。

6. 代码实现和参考资料

代码实现：您的代码实现看起来是合理的，但可能需要添加一些异常处理来捕获和处理运行时错误。
参考资料：您可以参考selenium的官方文档来获取更多关于如何使用selenium的信息：Selenium Documentation

建议的额外步骤

异常处理：在您的代码中添加异常处理，以便在遇到错误时能够提供更多信息。
日志记录：添加日志记录，记录关键步骤的执行情况，这有助于调试。
逐步调试：逐行执行代码，检查每个步骤的执行结果，特别是selenium操作部分。

示例代码添加异常处理

def download_annual_reports(company_codes): service = Service('C:\Program Files\ESBrowser\chromedriver.exe') driver = webdriver.Chrome(service=service) driver.get("http://www.cninfo.com.cn/new/index") try: for code, name in company_codes: try: # ... 省略其他代码 ... # 确保下载按钮点击后有实际的下载行为发生 download_button.click() time.sleep(5) # 等待时间可能需要根据实际情况调整 except Exception as e: print(f"Error downloading annual report for {code}: {e}") finally: driver.quit()

请注意，time.sleep(5)可能不足以确保文件下载完成，您可能需要根据实际情况调整等待时间或使用更高级的等待策略，如WebDriverWait和expected_conditions。

希望这些建议能帮助您解决问题。如果问题仍然存在，请提供更详细的错误信息或日志，以便进一步分析。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python怎么批量下载年报_Python+Wind 批量下载上市公司年报 - Part 1/2
2020-11-23 16:56

weixin_39723920的博客 Python+Wind 批量下载上市公司年报 - Part 1/2作者：张捷目录1.背景介绍2.安装Python3.爬取万得上市公司年报3.1Wind下载公告信息...经过一番查找，蚊子获知目前能获取上市公司年报的网站或数据库有巨潮资讯网、上交...
Python批量下载深圳证券交易所上市公司年度报告PDF文档的自动化爬虫工具_深交所公司年报PDF批量下载巨潮资讯网数据抓取股票代码多选去重处理合法合规网络爬虫_为金融研究人.zip
2025-08-28 15:48

通过Python编写的爬虫程序能够高效地访问巨潮资讯网，并抓取所需的数据。该工具具备的核心功能包括： 1. 股票代码的多选输入：用户可以根据研究需要，选择多个股票代码进行报告下载，这一功能大大提升了研究的灵活...
【工作提效】教你如何用Python轻松爬取上市公司年报，新手也能快速上手！copy即用
2024-07-09 21:05

Hdu-ABlue的博客利用python抓取上市公司年报，季度报告，问询函等信息，无需代码基础也可以上手即用
python 批量下载财务数据_Python+Wind 批量下载上市公司年报 - Part 1/2
2020-12-07 12:12

weixin_39852491的博客 Python+Wind 批量下载上市公司年报 - Part 1/2作者：张捷目录1.背景介绍2.安装Python3.爬取万得上市公司年报3.1Wind下载公告信息...经过一番查找，蚊子获知目前能获取上市公司年报的网站或数据库有巨潮资讯网、上交...
Python爬取上市公司年报[可运行源码]
2025-11-12 16:38

文章详细介绍了使用Python语言对巨潮资讯网进行数据爬取的过程，以便于获取上市公司的年度报告。首先，文章强调了在进行网络爬虫活动之前，要确保工具和编程环境已经准备就绪。这包括安装Python语言、相关的编程库，...
“学术之路”回顾 | Python科研应用系列分享会
2025-12-31 00:16

数据派THU的博客同学，为有志于学习编程但非计算机、非数据科学专业的同学提供极具实操性的“跨界科研工具箱”，通过三期连讲的形式，手把手带领同学们实现从静态网页解析到复杂动态数据抓取的科研进阶。随后，进一步讲解了多进程...
PDF-Extract-Kit金融版：年报关键数据自动提取，投资分析快人一步
2026-01-15 07:08

starlightowl56的博客本文介绍了基于“星图GPU”平台自动化部署PDF-Extract-Kit一个pdf智能提取工具箱二次开发构建by科哥镜像的完整方案，该镜像专为金融文档解析优化，可精准提取年报中的财务报表、附注等关键数据，实现结构化输出，...
学习大模型应用入门指南：MinerU云端体验，按需付费不怕投入大
2026-01-20 04:39

MoonbeamRaven28的博客可以去公开渠道下载：学术论文：arXiv.org 上随便搜一篇AI相关的PDF 财报：巨潮资讯网下载某上市公司年报扫描件：找一本电子书的影印版（注意版权）把这些文件上传到服务器的 /app/uploads/ 目录下备用。...
《投资-326》量化交易 -东方财富choice、Wind、同花顺、巨潮资讯、券商、交易所、上市公司、量化平台、财经网、雪球财经等他们各自的角色和关系
2025-11-18 14:53

文火冰糖的硅基工坊的博客关系类型示例数据流动上市公司 → 交易所 → 巨潮 → Wind/Choice → 券商/量化平台 → 投资者服务互补Wind 提供数据 → 量化平台用于回测 → 券商提供实盘通道竞争替代Wind vs Choice vs 同花顺iFinD（高端数据竞争...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月6日

python从巨潮资讯网批量下载指定范围年报

1条回答 默认 最新

1. 环境配置

2. 文件路径

3. 企业代码数据

4. 代码逻辑

5. 错误排查

6. 代码实现和参考资料

建议的额外步骤

示例代码添加异常处理

问题事件

1条回答默认最新