LSTM模型增加了实验的输入样本数量，损失函数的变化如两图所示

上图是1000个样本训练模型的损失函数（mape 平均绝对百分误差）结果，下图为样本数量增加到2000个，损失函数就看不懂了，每个epoch下降到80左右就上跳到一个较大的值，尤其是当mape在80多的时候accracy都为0。然后开始下降

附上模型代码

### model
taxi_id = Input(shape=(50, 1))
mask_1 = Masking(mask_value=0)(taxi_id)
embedding_1 = Embedding(15000, 14, mask_zero=True)(mask_1)
time_id = Input(shape=(50, 1))
mask_2 = Masking(mask_value=0)(time_id)
embedding_2 = Embedding(1440, 6, mask_zero=True)(mask_2)
busy = Input(shape=(50, 1))
mask_3 = Masking(mask_value=0)(busy)
embedding_3 = Embedding(2, 2, mask_zero=True)(mask_3)
concatenate_1 = Concatenate(axis=3)([embedding_1,embedding_2,embedding_3])
concatenate_1 = Lambda(dim_squeeze)(concatenate_1)
num_input = Input(shape=(50, 3))
mask_4 = Masking(mask_value=0, input_shape=())(num_input)
concatenate_2 = Concatenate(axis=2)([concatenate_1, mask_4])
blstm_1 = Bidirectional(LSTM(128,  activation='tanh', return_sequences=True, dropout=0.2))(concatenate_2)
blstm_2 = Bidirectional(LSTM(256,  activation='tanh', return_sequences=True, dropout=0.2))(blstm_1)
blstm_3 = Bidirectional(LSTM(128,  activation='tanh', return_sequences=True, dropout=0.2))(blstm_2)
dense_1 = Dense(128)(blstm_3)
leaky_relu_1 = advanced_activations.LeakyReLU(alpha=0.3)(dense_1)
dense_2 = Dense(128)(leaky_relu_1)
leaky_relu_2 = advanced_activations.LeakyReLU(alpha=0.3)(dense_2)
dense_3 = Dense(128)(leaky_relu_2)
leaky_relu_3 = advanced_activations.LeakyReLU(alpha=0.3)(dense_3)
dense_4 = Dense(128)(leaky_relu_3)
leaky_relu_4 = advanced_activations.LeakyReLU(alpha=0.3)(dense_4)
add_1 = add([leaky_relu_1, leaky_relu_2, leaky_relu_3, leaky_relu_4])
dense_5 = Dense(1, activation='linear')(add_1)
dense_5 = Lambda(dim_squeeze)(dense_5)
dense_5 = Dense(units = 1, activation='linear')(dense_5)
model = Model([taxi_id, time_id, busy, num_input], dense_5)

求大佬过目指点迷津，这样的损失函数意味着哪里出了问题，先行谢过

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-03-05 23:08
关注
你的batch设置多大，还有dropout=0.2搞小一点看看，另外你的优化器是什么，如果是ADAM以外的，那么学习率调整下

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
NLP-信息抽取-NER-2015-BiLSTM+CRF（二）：损失函数【BiLSTM+CRF模型适用于：中文分词、词性标注、命名实体识别】
2022-01-30 15:31

u013250861的博客在深度学习中，有一种模型可以同时胜任这三种工作，而且效果还很不错，那就是：BiLSTM_CRF。 BiLSTM指的是双向LSTM； CRF指的是条件随机场。以命名实体识别为例，我们规定：在数据集中有两类实体，人名和组织...
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
关于LSTM模型提取数据特征 tensorflow 人工智能深度学习自然语言处理
2020-04-24 23:35

回答 1 已采纳用fit训练，用predict预测－－－－－－－－－－－－－－－－－－－－－－－－－－－本来还想多说几句的，一看之前的回答都没有采纳。当我白说
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
猿创征文丨深度学习基于双向LSTM模型完成文本分类任务
2022-09-12 13:42

猿童学的博客大家好，我是猿童学，本期猿创征文的第三期，也是最后一期，给大家带来神经网络中的循环神经网络案例，基于双向LSTM模型完成文本分类任务，数据集来自kaggle，对电影评论进行文本分类。电影评论可以蕴含丰富的情感：...
如何使用LSTM和Transform等经典模型 lstm transformer 自然语言处理
2022-10-12 20:31

回答 1 已采纳建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1
找的lstm模型里没有学习率这个参数 python
2021-07-21 10:15

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 请看👉 ：深度学习-利用LSTM预测多输出如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
pytorch训练LSTM模型的代码疑问 python 人工智能深度学习神经网络
2019-08-09 11:55

回答 2 已采纳 ``` def __init__(self): super(Sequence,self).__init__() self.lstm1 = nn.LSTMCel
CNN-LSTM模型训练及预测瓦斯浓度
2024-03-05 16:41

NURBS.的博客所以在两个模型的中间需要对数据的维度进行转换，在卷积过程后先利用池化层放大特征信息，然后运用1*1卷积层和Squeeze层进行降维处理，最后将降维处理后的数据进行时序处理，从而实现对提取了空间关系的数据进行时序...
LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
四、长短期记忆网络（LSTM）数据驱动模型
2022-03-02 21:15

如灬初的博客长短期记忆网络（LSTM）数据驱动模型 5.1 基本原理长短时记忆网络(Long Short Term Memory Network, LSTM)，是一种改进之后的循环神经网络，可以解决RNN无法处理长距离的依赖的问题。在原始的 RNN 模型中，隐藏层...
深度学习基础入门篇[五]:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测
2023-04-18 09:46

汀、人工智能的博客 CRNN中，整体流程如图3 所示。图3 CRNN整体流程CRNN中，首先使用CNN提取图片特征，特征图的维度为m×Tm×Tm×Txx1x2xTxx1x2...xT然后，将特征图的每一列作为一个时间片送入LSTM中。令 t为代表时间维度的值，且满足1...
没有解决我的问题, 去提问

悬赏问题

¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。
¥15 SQL Server analysis services 服务安装失败

LSTM模型增加了实验的输入样本数量，损失函数的变化如两图所示

1条回答 默认 最新

悬赏问题

1条回答默认最新