lstm时间序列共享单车预测，loss值优化，参数优化算法

lstm时间序列，loss值很高
共享单车需求预测
如何优化代码，或者说我思路有问题？
该如何写
数据集
321行，特征字段weekday（0工作日，1非工作日）,weather（1晴，2多云）,meantemp
最好加上参数优化代码，另有报酬

# 加载数据集
dataset = pd.read_csv("../data/r_ultimate4.csv", parse_dates=['starttime'], index_col=['starttime'])
# 特征数据集
X = dataset.drop(columns=['count'], axis=1)
# 标签数据集
y = dataset['count']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False, random_state=6)
scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
X_train = pd.DataFrame(X_train)
X_test = pd.DataFrame(X_test)
# 2 构造特征数据集
def create_dataset(X, y, seq_len=3):
    features = []
    targets = []
    for i in range(0, len(X) - seq_len, 1):
        data = X.iloc[i:i + seq_len]
        label = y.iloc[i + seq_len]
        features.append(data)
        targets.append(label)
    return np.array(features), np.array(targets)
# 构造训练特征数据集
train_dataset, train_labels = create_dataset(X_train, y_train, seq_len=3)
# 构造测试特征数据集
test_dataset, test_labels = create_dataset(X_test, y_test, seq_len=3)
# print(train_dataset.shape)
# print(train_labels.shape)
# 构造批数据
def create_batch_dataset(X, y, train=True, buffer_size=100, batch_size=32):
    batch_data = tf.data.Dataset.from_tensor_slices((tf.constant(X), tf.constant(y)))  # 数据封装，tensor类型
    if train:  # 训练集
        return batch_data.cache().shuffle(buffer_size).batch(batch_size)
    else:  # 测试集
        return batch_data.batch(batch_size)
# # 训练批数据
train_batch_dataset = create_batch_dataset(train_dataset, train_labels)
# print(train_batch_dataset)
# 测试批数据
test_batch_dataset = create_batch_dataset(test_dataset, test_labels, train=False)
# print(train_dataset.shape)
# print(train_dataset)
# # 模型构建
model = Sequential()
model.add(LSTM(256, activation='relu', input_shape=train_dataset.shape[-2:]))
model.add(Dense(128, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dense(1))
optimizer = Adam(learning_rate=0.001)
# 模型编译
model.compile(optimizer='adam',loss='mean_squared_error')
checkpoint_file = "best_model.hdf5"
checkpoint_callback = ModelCheckpoint(filepath=checkpoint_file,
                                      monitor='loss',
                                      mode='min',
                                      save_best_only=True,
                                      save_weights_only=True)
# 模型训练
history = model.fit(train_batch_dataset,
                    epochs=1000,
                    validation_data=test_batch_dataset,
                    callbacks=[checkpoint_callback])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

18条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-05-05 08:34
关注
引自免费微信小程序：皆我百晓生

针对您提出的共享单车需求预测问题，以及遇到的高Loss值和参数优化的需求，我为您提供以下几点详细的优化建议：

1. 数据预处理

标准化：您已经在使用MinMaxScaler对数据进行标准化处理，这是很好的做法。但请注意，对于时间序列数据，尤其是包含周期性模式的，考虑使用StandardScaler可能更合适，因为它能更好地保留数据的分布特性。
序列长度选择：您选择了序列长度为3，这取决于数据的特性。考虑尝试不同的序列长度，比如更长的序列（如7天，以捕获周内周期性），并观察效果。

2. 特征工程

增加特征：除了现有的weekday、weather、meantemp，可以考虑添加更多与共享单车需求相关的特征，如节假日标识、历史骑行量、温度变化率等。
特征交叉：通过创建新特征来捕捉特征间的交互效应，如weather与meantemp的组合特征。

3. 模型结构优化

LSTM层调整：尝试减少LSTM单元数，比如从256降到128，过大的神经元数量可能会导致过拟合。
添加Dropout：在LSTM层后添加Dropout层，以防止过拟合。例如，可以在每个隐藏层后加入Dropout(0.2)。
双向LSTM：考虑使用双向LSTM以捕获输入序列的前向和后向依赖。
时间特征编码：将时间信息（如小时、日期、星期几）编码为额外的输入特征，可以使用循环神经网络（如Embedding）或固定大小的编码（如one-hot编码）。

4. 损失函数与优化器

损失函数：您正在使用均方误差（MSE）作为损失函数，这是回归问题的常见选择。如果目标值分布有偏斜，可以尝试使用平均绝对误差（MAE）或Huber损失。
优化器与学习率：您已使用Adam优化器，可以尝试其他优化器（如RMSprop或Adagrad），并考虑使用学习率衰减策略，比如LearningRateScheduler。
早停机制：加入EarlyStopping回调，当验证损失在一定轮次内不再下降时停止训练，以避免过拟合。

5. 参数调优

网格搜索：使用GridSearchCV或RandomizedSearchCV进行超参数优化，这需要较大的计算资源。
Bayesian Optimization：使用贝叶斯优化库（如hyperopt）来自动寻找最优参数组合。

6. 代码优化示例

基于以上建议，下面是对您代码的修改示例：

from tensorflow.keras.callbacks import EarlyStopping from sklearn.preprocessing import StandardScaler from keras.optimizers import Adam from keras.callbacks import LearningRateScheduler # 使用StandardScaler scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) # 添加Dropout model = Sequential() model.add(LSTM(128, activation='relu', input_shape=train_dataset.shape[-2:], return_sequences=True)) model.add(Dropout(0.2)) model.add(LSTM(64, activation='relu')) model.add(Dropout(0.2)) model.add(Dense(1)) # 使用学习率衰减 def scheduler(epoch, lr): if epoch % 100 == 0 and epoch != 0: return lr * 0.9 return lr lr_schedule = LearningRateScheduler(scheduler) # 添加EarlyStopping early_stopping = EarlyStopping(monitor='val_loss', patience=20) # 编译模型，使用优化的学习率和损失函数 optimizer = Adam(learning_rate=0.001) model.compile(optimizer=optimizer, loss='mean_squared_error') # 训练模型，加入更多的回调 history = model.fit(train_batch_dataset, epochs=1000, validation_data=test_batch_dataset, callbacks=[checkpoint_callback, lr_schedule, early_stopping])

请注意，这些优化措施需要根据您的具体数据和模型表现来逐步尝试和调整。希望这些建议能帮助您降低Loss值，并提高模型预测性能。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
PSO-LSTM时间序列预测模型在预测的时候Matlab每次运行结果不一样，该如何处理 lstm matlab 有问必答机器学习
2022-03-13 15:32

回答 2 已采纳可以设置随机数的种子，设置好后每次运行的结果就相同了，方法如下： rng(1) % 设置随机数种子为1 %% 然后开始随机数的取值操作计算
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
基于LSTM模型的共享自行车需求预测
2022-02-16 20:34

尤而小屋的博客今天给大家带来一篇新的kaggle数据分析实战案例：基于长短期记忆网络（LSTM）模型的伦敦自行车需求预测分析。本文的两个亮点：高级可视化：本文使用seaborn进行了可视化探索分析，图表精美，分析维度多样化，结论...
关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
用LSTM做时间序列预测，图画的挺准，准确度怎么这么差，有大佬知道大概怎么回事吗 tensorflow 人工智能机器学习深度学习神经网络
2020-04-08 23:27

回答 1 已采纳你用的是不是metric里的acc？那个只能是分类，不能用于回归
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
【数据竞赛】基于LSTM模型实现共享自行车需求预测
2022-02-18 12:00

风度78的博客公众号：尤而小屋作者：Peter编辑：Peter今天给大家带来一篇新的kaggle数据分析实战案例：基于长短期记忆网络（LSTM）模型的伦敦自行车需求预测分析。本文的两个亮点：高级可视化：...
以chickenpox_dataset为例用Topsis算法比较LSTM算法与BP神经网络算法时的疑问 matlab 神经网络算法
2023-02-17 21:51

回答 2 已采纳方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘” 根据这项研究，LSTM算法与BP神经网络算法在chickenpox_dataset上的预测效果几乎没有差别。因此，可以认为代码方面没有问题
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
LSTM的loss不断下降，但train和test的准确率始终在0.5左右 tensorflow 机器学习深度学习神经网络自然语言处理
2019-07-19 10:18

回答 3 已采纳 LSTM是用来做文本生成，做垃圾邮件识别似乎没有什么道理。你的loss用的可能是MSE，平方误差对于大的误差的减小比较敏感，但是对于最终的分类没有什么帮助，就导致acc没有什么变化loss一直下降
共享单车数据分析
2019-03-26 10:14

mingxiaod的博客 Duration：骑行持续时间，数据形式：844108ms和14h 26min. 2sec Start date：开始日期，数据形式：12/31/2010 23:49 End date：结束日期，数据形式：1/1/2011 14:15 Start station ：起始站，数据形式：10th &...
Lstm神经网络能否调整输出层的节点数使其对于预测点输出两个值? matlab python 有问必答机器学习
2022-03-13 21:45

回答 2 已采纳肯定是可以的，keras的话调整搭建模型的输出层就行（layers.Dense(2)），matlab里的没咋用过，等别人回答~
深度学习Pytorch（一）之共享单车预测网络
2022-11-17 02:15

奥利奥利奥利奥的博客 plt.legend([xplot, yplot],['Data', str1]) #绘制图例 plt.show() 三、人工神经网络预测器1（未进行属性归一化）利用前50条数据的标签值、进行1~50的编号（单一属性X∈[1,50]）搭建1（input）-10（hidden1）-1...
手把手写深度学习(17)：用LSTM为图片生成文字描述(Image-to-text任务)
2022-09-15 07:45

沉迷单车的追风少年的博客近年来text-to-image的任务非常火爆，大模型如Della、Imagen、GLIDE等都取得了良好的效果；其镜像任务image-to-text的相关研究却比较少，这篇博客手把手带大家用简单的LSTM网络搭建一个image-to-text系统。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 5月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月5日
展开全部

悬赏问题

¥15 拟通过pc下指令到安卓系统，如果追求响应速度，尽可能无延迟，是不是用安卓模拟器会优于实体的安卓手机？如果是，可以快多少毫秒？
¥20 神经网络Sequential name=sequential, built=False
¥16 Qphython 用xlrd读取excel报错
¥15 单片机学习顺序问题！！
¥15 ikuai客户端多拨vpn，重启总是有个别重拨不上
¥20 关于#anlogic#sdram#的问题，如何解决？(关键词-performance)
¥15 相敏解调 matlab
¥15 求lingo代码和思路
¥15 公交车和无人机协同运输
¥15 stm32代码移植没反应

lstm时间序列共享单车预测，loss值优化，参数优化算法

18条回答 默认 最新

1. 数据预处理

2. 特征工程

3. 模型结构优化

4. 损失函数与优化器

5. 参数调优

6. 代码优化示例

问题事件

悬赏问题

18条回答默认最新