python数据挖掘：分析师评级报告的投资决策分析

这是网站找到爬虫程序，主要任务是爬虫巨潮网上市公司及评级信息，
https://blog.csdn.net/c1007857613/article/details/130243238?ops_request_misc


import pandas as pd
from selenium import webdriver
import time
import re
import datetime


import warnings

warnings.filterwarnings("ignore")

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome = webdriver.Chrome(options=chrome_options)

start_date = datetime.datetime.now()
end_date = start_date - datetime.timedelta(days=90)
end_date = end_date.strftime('%Y-%m-%d')

url = 'http://data.eastmoney.com/report/stock.jshtml'
chrome.get(url)
content = chrome.page_source
#总页码和下一页按钮的xpath：即在网页html中的位置
total_xpath = '//*[@id="stock_table_pager"]/div[1]/a[7]'
next_xpath = '//*[@id="stock_table_pager"]/div[1]/a[last()]'
#找到总页码并解析到总页码
total_page = chrome.find_element_by_xpath(total_xpath).text

page = 0
data_all = pd.DataFrame()
while(True): #循环多页爬取
    content = chrome.page_source
    # print(content)

    #因为网页上的数据是一个表格，可使用read_html方法直接解析表格
    tables = pd.read_html(content)
    print(len(tables))
    print(tables)
    table = tables[1] #我们要的数据在第二个表格中

    if end_date in table['日期'].values:  #如果数据中的日期在我们设定的截止日期之前就不要了
        break

    #股票代码可能以0开头，而read_html解析出来的股票代码自动把0去掉了，因此需要从新解析股票代码
    #使用正则解析股票代码
    p_code = '<a href="//quote.eastmoney.com/unify/.*?">(.*?)</a>'
    code = re.findall(p_code, content)
    table['股票代码'] = code


    #每一页解析的数据拼接在一起
    data_all = pd.concat([data_all,table],ignore_index=True)
    print('第' + str(page + 1) + '页爬取完成！')
    #翻页，继续爬取解析下一页的数据
    chrome.find_element_by_xpath(next_xpath).click()
    page = page + 1
    time.sleep(3)


#限定只需要某些列的数据
columns = ['股票代码','股票简称','东财评级','评级变动','机构','日期']
data_all = data_all[columns]
#将数据写入到excel文件中去
data_all.to_excel('eastmoney.xlsx',index='index')

执行以下程序报错如下：

line 39, in <module>
    table = tables[1] #我们要的数据在第二个表格中
            ~~~~~~^^^
IndexError: list index out of range

通网页元素查询，应该有两个表格，但是错误现实不能识别第二个表格；

从网站上看是1个表格，但是从元素上是两个表格。请问大家这个程序应该如何修正程序解决这个问题。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

11条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-10-23 12:28
关注
引自强大而免费的微信小程序：皆我百晓生。

根据报错信息显示，在第39行代码中，程序尝试访问表格列表中的第二个表格(table[1])，但是该列表中只有一个表格。这导致了IndexError错误。

解决该问题的一个方法是，先检查表格列表的长度，如果长度小于2，则直接退出循环，否则再访问第二个表格。修改的代码如下：

# ... tables = pd.read_html(content) if len(tables) < 2: break table = tables[1] # ...

通过这样的修改，程序会先检查表格列表的长度，如果长度小于2，则直接退出循环，这样就避免了访问越界的问题。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(10条)

报告相同问题？

关注问题

如今的大数据时代，想成为一名合格的Python数据分析师到底需要掌握哪些技能？数据分析师又被分为哪几个等级？
2022-05-02 10:06

Junn225的博客那么数据分析师在一个企业里到底是做什么呢？其实数据分析师只需要做两件事，你没听错，就是两件事 1.满足数据需求简单用七个字概括：取数、做表、搭监控取数：通过工具提取所要数据，或者通过爬虫简单...
python金融数据分析与挖掘实战_[套装书]Python数据分析与挖掘实战（第2版）+Python金融大数据挖掘与分析全流程详解+Python金融数据分析（3册）...
2020-12-06 14:51

weixin_39644021的博客 ---------------------------Python数据分析与挖掘实战(第2版)---------------------------前言基础篇第1章　数据挖掘基础 21.1　某知名连锁餐饮企业的困惑 21.2　从餐饮服务到数据挖掘 41.3　数据挖掘的基本任务 ...
python数据分析培训内容可以_Python数据分析师
2020-11-25 11:15

weixin_39588679的博客数据分析师认知篇说明：0基础入学，5大进阶之路，8大课程阶段，35+课程，1000+学时，18大行业经典案例，两大商业项目实战！人工智能是你的终极目标！课程时长：约66天，每天不低于6小时授课方式：线下面授+翻转课堂...
大数据领域数据预处理：优化数据分析流程的关键步骤
2025-09-13 03:01

AI软件工程实践的博客在当今数字化时代，大数据已经成为企业和组织决策的重要依据。然而，原始数据往往存在各种问题，如缺失值、噪声、重复数据等，这些问题会严重影响数据分析的准确性和有效性。因此，数据预处理的目的就是对原始数据...
CDA数据分析师教学内容.pdf
2022-07-04 07:00

2. SAS数据挖掘：学习SAS基础编程、高级编程、统计分析，以及在电商数据挖掘和信用评级模型中的应用。此外，课程还涉及大数据分析的前沿知识，如Hadoop入门、Linux基础、Hadoop集群部署、数据导入与存储、Hbase...
用户画像质量评估：大数据分析的5个关键指标
2025-09-30 23:30

AI 项目管理的博客然而，企业常面临"画像不准"“数据打架”"维度缺失"等问题，导致基于画像的决策出现偏差。本文聚焦大数据环境下用户画像的质量评估体系，构建包含完整性、准确性、时效性、一致性、丰富性的五大核心指标，覆盖从数据...
数据挖掘与商务智能期末报告——构建客户信用评分模型
2024-06-04 14:09

了独山的博客本文尝试构建客户信用评分模型。数据探索：数据描述统计和数据可视化数据预处理：数据标准...建模：采用logistic回归、支持向量机、决策树、集成模型、贝叶斯模型、神经网络等。分类效果评估（明确评估指标和方法）
股市分析：个股的数据建模
2025-12-24 20:48

belldeep的博客个股数据建模是一套从数据到策略的完整量化流程，核心在于数据闭环、特征工程、模型适配与严格回测，以捕捉价格 / 收益的可解释规律并控制风险。
建筑建材行业日报：河南2018年水泥行业错峰力度加大.pdf
2021-07-08 23:59

通过使用这些数据源，分析师能够快速获取实时和历史数据，并利用统计软件或编程语言（如Python、R语言等）进行深入的数据挖掘和模型构建，预测股票或行业的未来走势。 4. 行业数据报告的生成：行业日报报告的生成...
python资本市场财务数据分析_Python金融业数据化运营实战
2020-11-24 04:46

weixin_39870155的博客原标题：Python金融业数据化运营实战目前数据分析已经深入到各个行业中，尤其以Python为工具的数据分析将越来越流行，目前数据分析在金融领域的应用是最广阔的，了解或者掌握了Python金融数据分析，对于今后就业相当...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月23日

python数据挖掘：分析师评级报告的投资决策分析

11条回答 默认 最新

问题事件

11条回答默认最新