stephen_yoga 2025-07-23 15:53 采纳率: 50%
浏览 8

关于#人工智能#的问题:我在做地铁流量预测的任务 请问有没有国外地铁数据集 类似国内的北京杭州上海这样的

我在做地铁流量预测的任务 请问有没有国外地铁数据集 类似国内的北京杭州上海这样的

  • 写回答

5条回答 默认 最新

  • 檀越@新空间 2025-07-23 15:59
    关注

    下午好🌅🌅🌅
    本答案参考通义千问

    在进行地铁流量预测任务时,确实需要大量的历史数据来训练模型。国内如北京、上海、杭州等地的地铁系统都有公开的数据集,但如果你希望使用国外地铁数据集来进行研究或对比分析,以下是一些推荐的数据来源和资源:


    一、国外地铁数据集推荐

    1. New York City Subway (MTA)

    • 网址https://new.mta.info/
    • 特点
      • 提供纽约地铁的实时和历史客流数据。
      • 包括车站进出站人数、列车运行时间等信息。
    • 适用场景:适合用于城市交通流量预测、高峰时段识别等。

    2. London Underground (TfL)

    • 网址https://tfl.gov.uk/modes/subway
    • 特点
      • 提供伦敦地铁的历史运营数据。
      • 可以通过API获取实时数据(需注册)。
    • 适用场景:适用于城市轨道交通流量建模与预测。

    3. Paris Metro (RATP)

    • 网址https://www.ratp.fr
    • 特点
      • 提供巴黎地铁的乘客流量、列车运行状态等信息。
      • 部分数据可下载为CSV或JSON格式。
    • 适用场景:可用于区域化流量预测模型开发。

    4. Tokyo Metro (Tokyo Metropolitan Transportation Bureau)

    • 网址https://www.metro.tokyo.jp
    • 特点
      • 提供东京地铁的客流量统计。
      • 数据包括各线路、车站的上下车人数。
    • 适用场景:适用于高密度城市交通预测模型。

    5. Singapore MRT (Land Transport Authority)

    • 网址https://www.lta.gov.sg
    • 特点
      • 提供新加坡地铁的运营数据。
      • 包括每日客流量、列车准点率等。
    • 适用场景:适合研究公共交通优化与预测。

    二、通用交通数据平台(适合多国数据)

    1. OpenStreetMap + OpenTripPlanner

    2. Kaggle

    • 网址https://www.kaggle.com
    • 特点
      • 拥有大量公开的地铁及交通数据集。
      • 包括纽约、伦敦、巴黎等城市的地铁数据。
    • 适用场景:适合初学者快速获取数据并进行实验。

    三、如何使用这些数据进行地铁流量预测?

    1. 数据预处理

    • 清洗数据:去除缺失值、异常值。
    • 特征工程:提取时间序列特征(如小时、星期、节假日等)。
    • 标准化/归一化:对数值型特征进行处理。

    2. 模型选择

    • 传统模型:ARIMA、SARIMA、Prophet
    • 机器学习模型:XGBoost、Random Forest、LSTM
    • 深度学习模型:Transformer、GRU、CNN-LSTM

    3. 代码示例(LSTM模型)

    import pandas as pd
    from sklearn.preprocessing import MinMaxScaler
    from tensorflow.keras.models import Sequential
    from tensorflow.keras.layers import LSTM, Dense
    
    # 加载数据(假设是纽约地铁数据)
    data = pd.read_csv('nyc_subway_data.csv', parse_dates=['timestamp'])
    
    # 提取目标列(如某站点的乘客数)
    target_column = 'passenger_count'
    
    # 特征缩放
    scaler = MinMaxScaler()
    scaled_data = scaler.fit_transform(data[[target_column]])
    
    # 构建时间序列数据
    def create_dataset(data, time_steps=1):
        X, y = [], []
        for i in range(len(data)-time_steps-1):
            X.append(data[i:(i+time_steps), 0])
            y.append(data[i + time_steps, 0])
        return np.array(X), np.array(y)
    
    time_steps = 60  # 使用前60个时间步预测下一个
    X, y = create_dataset(scaled_data, time_steps)
    
    # 调整形状以适应LSTM输入
    X = X.reshape((X.shape[0], X.shape[1], 1))
    
    # 构建LSTM模型
    model = Sequential()
    model.add(LSTM(50, return_sequences=True, input_shape=(X.shape[1], 1)))
    model.add(LSTM(50))
    model.add(Dense(1))
    
    model.compile(optimizer='adam', loss='mse')
    
    # 训练模型
    model.fit(X, y, epochs=20, batch_size=32, validation_split=0.1)
    
    # 预测未来一天的客流
    last_60_days = scaled_data[-60:]
    prediction = model.predict(last_60_days.reshape(1, 60, 1))
    predicted_value = scaler.inverse_transform(prediction)
    print("Predicted passenger count:", predicted_value[0][0])
    

    四、总结

    重点总结如下

    1. 国外地铁数据集推荐
      • 纽约(MTA)、伦敦(TfL)、巴黎(RATP)、东京(Tokyo Metro)、新加坡(LTA)。
    2. 通用数据平台
      • Kaggle、OpenStreetMap、OpenTripPlanner。
    3. 模型建议
      • LSTM、XGBoost、Prophet等。
    4. 代码示例
      • 提供了一个基于LSTM的地铁流量预测模型代码片段。

    如果你有具体的城市或数据格式需求,我可以进一步帮助你定制数据处理和模型构建方案。

    评论

报告相同问题?

问题事件

  • 创建了问题 7月23日