我在做地铁流量预测的任务 请问有没有国外地铁数据集 类似国内的北京杭州上海这样的
5条回答 默认 最新
檀越@新空间 2025-07-23 15:59关注下午好🌅🌅🌅
本答案参考通义千问在进行地铁流量预测任务时,确实需要大量的历史数据来训练模型。国内如北京、上海、杭州等地的地铁系统都有公开的数据集,但如果你希望使用国外地铁数据集来进行研究或对比分析,以下是一些推荐的数据来源和资源:
一、国外地铁数据集推荐
1. New York City Subway (MTA)
- 网址:https://new.mta.info/
- 特点:
- 提供纽约地铁的实时和历史客流数据。
- 包括车站进出站人数、列车运行时间等信息。
- 适用场景:适合用于城市交通流量预测、高峰时段识别等。
2. London Underground (TfL)
- 网址:https://tfl.gov.uk/modes/subway
- 特点:
- 提供伦敦地铁的历史运营数据。
- 可以通过API获取实时数据(需注册)。
- 适用场景:适用于城市轨道交通流量建模与预测。
3. Paris Metro (RATP)
- 网址:https://www.ratp.fr
- 特点:
- 提供巴黎地铁的乘客流量、列车运行状态等信息。
- 部分数据可下载为CSV或JSON格式。
- 适用场景:可用于区域化流量预测模型开发。
4. Tokyo Metro (Tokyo Metropolitan Transportation Bureau)
- 网址:https://www.metro.tokyo.jp
- 特点:
- 提供东京地铁的客流量统计。
- 数据包括各线路、车站的上下车人数。
- 适用场景:适用于高密度城市交通预测模型。
5. Singapore MRT (Land Transport Authority)
- 网址:https://www.lta.gov.sg
- 特点:
- 提供新加坡地铁的运营数据。
- 包括每日客流量、列车准点率等。
- 适用场景:适合研究公共交通优化与预测。
二、通用交通数据平台(适合多国数据)
1. OpenStreetMap + OpenTripPlanner
- 网址:https://www.openstreetmap.org / https://opentripplanner.com
- 特点:
- 提供全球范围内的交通网络数据。
- 可结合其他数据源进行流量预测建模。
- 适用场景:适用于多城市、多国家的交通数据整合与建模。
2. Kaggle
- 网址:https://www.kaggle.com
- 特点:
- 拥有大量公开的地铁及交通数据集。
- 包括纽约、伦敦、巴黎等城市的地铁数据。
- 适用场景:适合初学者快速获取数据并进行实验。
三、如何使用这些数据进行地铁流量预测?
1. 数据预处理
- 清洗数据:去除缺失值、异常值。
- 特征工程:提取时间序列特征(如小时、星期、节假日等)。
- 标准化/归一化:对数值型特征进行处理。
2. 模型选择
- 传统模型:ARIMA、SARIMA、Prophet
- 机器学习模型:XGBoost、Random Forest、LSTM
- 深度学习模型:Transformer、GRU、CNN-LSTM
3. 代码示例(LSTM模型)
import pandas as pd from sklearn.preprocessing import MinMaxScaler from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense # 加载数据(假设是纽约地铁数据) data = pd.read_csv('nyc_subway_data.csv', parse_dates=['timestamp']) # 提取目标列(如某站点的乘客数) target_column = 'passenger_count' # 特征缩放 scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data[[target_column]]) # 构建时间序列数据 def create_dataset(data, time_steps=1): X, y = [], [] for i in range(len(data)-time_steps-1): X.append(data[i:(i+time_steps), 0]) y.append(data[i + time_steps, 0]) return np.array(X), np.array(y) time_steps = 60 # 使用前60个时间步预测下一个 X, y = create_dataset(scaled_data, time_steps) # 调整形状以适应LSTM输入 X = X.reshape((X.shape[0], X.shape[1], 1)) # 构建LSTM模型 model = Sequential() model.add(LSTM(50, return_sequences=True, input_shape=(X.shape[1], 1))) model.add(LSTM(50)) model.add(Dense(1)) model.compile(optimizer='adam', loss='mse') # 训练模型 model.fit(X, y, epochs=20, batch_size=32, validation_split=0.1) # 预测未来一天的客流 last_60_days = scaled_data[-60:] prediction = model.predict(last_60_days.reshape(1, 60, 1)) predicted_value = scaler.inverse_transform(prediction) print("Predicted passenger count:", predicted_value[0][0])
四、总结
重点总结如下:
- 国外地铁数据集推荐:
- 纽约(MTA)、伦敦(TfL)、巴黎(RATP)、东京(Tokyo Metro)、新加坡(LTA)。
- 通用数据平台:
- Kaggle、OpenStreetMap、OpenTripPlanner。
- 模型建议:
- LSTM、XGBoost、Prophet等。
- 代码示例:
- 提供了一个基于LSTM的地铁流量预测模型代码片段。
如果你有具体的城市或数据格式需求,我可以进一步帮助你定制数据处理和模型构建方案。
解决 无用评论 打赏 举报