集成电路科普者 2025-07-20 02:10 采纳率: 98.7%
浏览 41
已采纳

如何用Python统计A股市场每日上涨与下跌家数?

**问题描述:** 如何使用Python统计A股市场每日的上涨与下跌家数?需要获取A股所有股票的实时或历史行情数据,计算每只股票当日的涨跌幅,并按日统计上涨和下跌的股票数量。常见难点包括:如何高效获取全市场数据、如何处理停牌或无交易数据的情况、如何按日期分组统计涨跌家数。请结合Tushare、Akshare等金融数据接口,给出一个完整的Python实现方案,并说明如何优化性能以应对大量数据的处理需求。
  • 写回答

1条回答 默认 最新

  • fafa阿花 2025-07-20 02:10
    关注

    一、问题背景与核心需求

    在A股市场中,统计每日上涨与下跌股票数量是分析市场情绪和趋势的重要指标之一。该任务的核心目标是:获取全市场股票的历史行情数据,计算每只股票每日的涨跌幅,并按日期统计上涨与下跌的股票数量。

    实现该目标面临以下技术挑战:

    • 如何高效获取A股市场所有股票的历史行情数据?
    • 如何处理停牌、无交易日等异常数据?
    • 如何按日期分组统计涨跌家数?
    • 如何优化性能以应对大量数据的处理?

    二、数据源选择与接口分析

    目前常用的金融数据接口有Tushare和Akshare,它们各有优劣:

    数据接口优点缺点
    Tushare数据结构清晰,文档完善,支持多种金融数据免费版本有调用频率限制,需申请Token
    Akshare免费无Token限制,接口丰富部分接口文档不完善,数据格式不统一

    本文将以Tushare为主,给出完整实现方案,并简要说明Akshare的替代方案。

    三、实现步骤与代码逻辑

    整体流程如下图所示:

    graph TD
        A[获取A股所有股票代码] --> B[按日期获取历史行情数据]
        B --> C[计算每只股票的涨跌幅]
        C --> D[过滤停牌或无交易数据]
        D --> E[按日期分组统计涨跌家数]
        E --> F[输出结果]
      

    1. 获取A股所有股票代码

    使用Tushare的pro.stock_basic接口获取所有A股股票代码:

    import tushare as ts
    ts.set_token('your_token_here')
    pro = ts.pro_api()
    
    # 获取A股所有股票代码
    df_stocks = pro.stock_basic(exchange='', list_status='L', fields='ts_code')

    2. 获取历史行情数据

    使用pro.daily接口获取每日行情数据:

    import pandas as pd
    
    # 获取指定日期范围的历史行情数据
    start_date = '20240101'
    end_date = '20240131'
    
    df_daily = pd.concat([pro.daily(ts_code=code, start_date=start_date, end_date=end_date) for code in df_stocks['ts_code']])

    3. 计算涨跌幅并处理异常数据

    涨跌幅计算公式为:(收盘价 - 前一日收盘价) / 前一日收盘价 * 100

    # 计算涨跌幅
    df_daily['pct_chg'] = df_daily.groupby('ts_code')['close'].pct_change() * 100
    
    # 过滤停牌或无交易数据(成交量为0)
    df_valid = df_daily[df_daily['vol'] > 0]

    4. 按日期统计涨跌家数

    # 按日期统计涨跌家数
    result = df_valid.groupby('trade_date').apply(lambda x: pd.Series({
        'up_count': (x['pct_chg'] > 0).sum(),
        'down_count': (x['pct_chg'] < 0).sum()
    })).reset_index()

    四、性能优化与扩展建议

    当处理大量股票和历史数据时,性能问题将变得尤为突出。以下是优化建议:

    • 多线程/异步请求: 使用concurrent.futuresasyncio并行获取数据。
    • 批量读取与缓存: 将历史数据保存为本地文件(如Parquet、HDF5),避免重复请求。
    • 增量更新: 每次仅获取新增日期的数据,而非全量数据。
    • 使用Akshare替代方案: Akshare无需Token,适合轻量级项目。

    例如使用Akshare获取行情数据:

    import akshare as ak
    
    # 获取A股历史行情数据
    stock_zh_a_hist_df = ak.stock_zh_a_hist(symbol="000001", period="daily", start_date="20240101", end_date="20240131")
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已采纳回答 10月23日
  • 创建了问题 7月20日