急求!!!用tensorflow搭了lstm的模型进行负荷预测,求问有没有大佬知道loss值已知很大的原因是什么?

用tensorflow搭了lstm的模型进行负荷预测,求问有没有大佬知道loss值已知很大的原因是什么?最近在做的项目,lstm层数由2层改了三层还是不行 。其他的参数调节又没有方向。
如题!急求!非常感谢!

0
weixin_43913642
萱er 可以加你QQ问些问题吗,我也是研究lstm的,我的QQ1481469446
4 个月之前 回复
caozhy
贵阳挖掘机马善福,自备车辆专业挖游泳池 回复caozhy: 另外看下你的损失函数是mae还是mse
8 个月之前 回复
caozhy
贵阳挖掘机马善福,自备车辆专业挖游泳池 要看你的数据集和程序才知道,传到网盘帮你看下
8 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
LSTM电力预测 ~期末大作业~
LSTM预测电力消耗:如果有不清楚LSTM的,可以看下我的这张珍藏了多年的老图,简单明了!今天看到了深度学习课程期末大作业要求,要提交一个RNN预测电力消耗的程序,作为一个攻克生,下意识地百度了一下,发现要不就是版本太老,要不就是代码有问题。。。于是今天动手写了一个,以解大家燃眉之急!仅给刚接触的小白参考用,大神勿喷,时间仓促,写的时候没有做注释,谅解~~作业的要求是基于20个已知的数据,预测1个...
深度学习框架下LSTM网络在短期电力负荷预测中的应用
准确的电力负荷预测可以保证电力供应的稳定,降低用电成本,提高供电质量。在进行短期电力负荷预测时,考虑到时序数据的时间相关性,应用张量流深度学习框架构建了LSTM 神经网络模型,对电力负荷时序数据进行回归预测
深度学习之LSTM案例分析(三)
#背景nn来自GitHub上《tensorflow_cookbook》【https://github.com/nfmcclure/tensorflow_cookbook/tree/master/09_Recurrent_Neural_Networks】nnnnStacking Multiple LSTM LayersnnWe stack multiple LSTM layers to impro...
基于深度学习LSTM网络的短期电力负荷预测方法
文章在深度学习理论的基础上应用LSTM网络对电力负荷进行了预测,具有较高的应用价值。
基于Keras的LSTM进行电力负荷预测
    首先,在之前毫无深度学习基础的情况下,花费了近11小时(包括在火车上读了一小时代码),最终完成本次大作业。    接下来这篇文章将完整叙述一个只有linux基础的菜鸟是如何完成这项大作业任务的。    文章也不再以严谨的科技论文写作格式进行,同时代码将托管在github上,文章同时发布在CSDN上,谨以此希望更多的中国学生可以将自己的成果,在不泄密的情况下,敢于分享,让更多人受益,交流,d...
基于神经网络的电力负荷预测代码
代码通过MATLAB实现了电力负荷预测,代码使用BP网络模型
RNN中利用LSTM来预测sin函数
前言:这个例子是用LSTM来预测sin函数的问题,期间遇到了一个了十分致命的问题,就是构造数据的时候,没有把数据构造成序列,所以一直在报维度上的错误,以后对时序问题的预测要格外注意数据是否是序列的数据,否则很难检查出问题,中间的问题其实比较好看出来,一调试就能解决。nn这个实例来自于《TensorFlow实战Google深度学习框架》nn先给出错误的代码示例,以便给自己一个警醒。nnn# !/us...
基于Keras深度学习LSTM模型 预测黄金主力收盘价
深度学习框架 Keras,深度学习LSTM模型nn1 数据源:黄金主力数据 来源于JQData (数据由JQData支持 )nn2 数据清洗nn3 使用黄金主力数据 进⾏预测的2个实验nn使用Keras实现收盘价预测,主要⽤到循环神经⽹网络即RNN(Recurrent Neural Network)中的LSTM(Long Short-Term Memory)nnn实验1:nn使用历史若前5个时刻的...
Tensorflow的loss函数计算容易出错的地方
1 问题的提出rn按照tensorflow官方教程搭建好的一个model中的loss函数应该是采用如下的计算方法:rncross_entropy = -tf.reduce_sum(y_*tf.log(y))rnrn其中,这个公式就是按照标准的交叉熵函数进行定义的,比较简陋,去掉了常数项系数,但是没改变总体的性质,所以算是基本交叉熵函数。rn但是呢,tensorflow系统中提供了计算交叉熵函数的接
基于Keras的单变量单时间步长LSTM电力负荷预测(一)
这几天一直在研究LSTM,想着用LSTM做个电力负荷预测,之前用Tensorflow搭建怎么也调试不好,一度崩溃。无奈换成Keras,Keras搭建LSTM结构整体思路看着非常清晰,程序量也较少。现将程序分享给大家一起交流学习。nn这里我搭建的是单变量LSTM模型,数据为简单的m*1形式,m为样本数,运行环境为jupyter notebooknn1、目的:使用LSTM由当前小时的电力负荷预测下一小...
tensorflow训练网络时loss出现nan值,准确率为0的问题解决方法(尝试)
问题:在使用tensorflow训练网络的时候,发现每次一个batch训练时,它的loss都为nan,导致准确率都为0。nan是代表无穷大或者非数值,一般在一个数除以0时或者log(0)时会遇到无穷大,所以你就要想想是否你在计算损失函数的时候,你的网络输出为0,又计算log,从而导致出现nan。网上也有很多原因的解释,比如学习率过大,batch过大,或者本身数据就很脏等等原因,我尝试减小学习率,从...
TensorFlow实战——RNN(LSTM)——预测sin函数
http://blog.csdn.net/u011239443/article/details/73650806关于LSTM可以参阅:http://blog.csdn.net/u011239443/article/details/73196473 n完整代码:https://github.com/xiaoyesoso/TensorFlowinAction/blob/master/InActionB1
tensorflow中损失函数总结
(1)sequence_loss_by_example(logits, targets, weights) n这个函数用于计算所有examples的加权交叉熵损失,logits参数是一个2D Tensor构成的列表对象,每一个2D Tensor的尺寸为[batch_size x num_decoder_symbols],函数的返回值是一个1D float类型的Tensor,尺寸为batch_size
训练网络出现loss突然上升或者直接NaN......
粗略写一下:rnrnrn解决方式,把初始化方式换掉。。。我们之前用的切断正态分布,,现在考虑下:rnhttp://blog.csdn.net/shuzfan/article/details/51338178rnrnrnrn经验说:rn1.一般我们都会用优秀的modelzoo参数初始化我们的参数,可能是这个参数值过大的问题。rn2.不恰当的loss函数。rn待续......
5分钟用keras实验LSTM时间序列预测最简单版,简单就是一切!能运行就是一切!
输入测试数据,这里以sin函数为例:nnndata = np.sin(x)nprint(data)nn[0.         0.14943813 0.29552021 ... 0.96101339 0.90890233 0.83637928]n这个函数你可以随便写,也可以展开应用,开个脑洞:nn一,把一首歌的单声部时序录入,如果是多声部,如钢琴,录入多次运行多次好了。nn比如理查德的经典和弦套路...
tensorflow 1.3 lstm训练和预测铁路客运数据
使用LSTM预测铁路客运时间序列,代码在tensorflow 1.3上调试运行通过,解决了网络相关资源的一些坑(很多资源不是tensorflow的版本太旧就是数据与铁路客运数据不太匹配,难以直接运行测试),不需要建立train模型和test模型(被绕了半天,这种测试应该毫无必要),可对不同的超参数组合比较训练误差和学习误差!
使用Tensorflow训练一元线性模型
我的原文:https://www.hijerry.cn/p/26959.htmlnn引言nn这是一次使用python进行机器学习的实验。nn一是总结自己学过的各种python包,二是了解一下使用python进行机器学习大概是什么样的,不过这次使用主要的目的还是熟悉Tensorflow的使用。nn本次实验使用到的python包及其版本:nnnTensorflow 1.8.0nNumpy 1.14.3...
TensorFlow实战——使用LSTM预测彩票
原创文章,转载请注明出处n请安装TensorFlow1.0,Python3.5,seaborn n项目地址: nhttps://github.com/chengstone/LotteryPredictn使用人工智能技术来预测彩票,是这次的主题,那么预测哪种彩票呢?我们先选择简单一些的,就是排列组合少一些的,如果证明我们的模型work,再扩展到其他的彩票上,最终我选择了排列三。
tensorflow保持每次训练结果一致
在用tensorflow构建神经网络的时候,有很多随机的因素,比如参数的随机初始化: 正态分布随机变量tf.random_normal([m,n]),均匀分布的随机变量tf.random_uniform([m,n]),还有在从tfrecord读取数据时,也会随机打乱数据。nn那么由于这些随机的操作,即使是在输入数据完全一样的情况下,每次训练的结果也不一样,那么如果想要使得每次训练的结果一致,应该怎...
利用LSTM原理预测股市
利用深度学习的长短记忆原理(LSTM)对美国纳斯达克股市进行预测。
利用LSTM对股票的收盘价进行回归预测
基于机器学习的股票分析三、利用神经网络对股票的日收盘价进行回归预测import tushare as tsnimport pandas as pd nimport numpy as npnfrom datetime import datetimenfrom pandas import read_csvnfrom pandas import DataFramenfrom pandas import c
损失还很高但是模型不收敛了怎么办?
陷入局部最优?nsgd:调大学习率n换用adam等优化方法n递进学习->1000->10000->80000n调小batch:(A.全部数据作为一个batch和 B.每个采样作为一个batch)一般用的时候,在非监督训练阶段,可以先用B方法创建初始模型, n然后在监督训练阶段,选择小batch size进行初步训练,让模型跳出局部极值,之后用大的batch size让模型收敛,这样一般能达到比较好的
Tensorflow学习笔记之利用DNNRegressor进行时序预测
Tensorflow学习笔记之利用DNNRegressor进行时序预测nn Tensorflow高级库的DNNRegressor很方便使用,如同sklearn库一样的简单,只要定义好数据格式,然后fit然后predict就可以了,时序预测中最出名的恐怕lstm了,但是最近在使用它时,对于数据缺失和数据量少的情况感觉预测不是很好,受到同事的启发,利用DNN来进行预测,效果还行,记录下方便以后查看。 ...
[TensorFlow深度学习入门]实战十·用RNN(LSTM)做时间序列预测(曲线拟合)
[TensorFlow深度学习入门]实战十·用RNN(LSTM)做时间序列预测(曲线拟合)n%matplotlib inlinenimport osnos.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"nimport numpy as np nimport matplotlib.pyplot as pltnimport tensorflow as tfnnn# hyp...
tensorflow实现多元线性回归时预测出的参数为nan
这是由于在用feed_dict 进行数据喂养之前没有做数据归一化:解决办法:使用sklearn包中的preprocessing做归一化:大妈如下from sklearn import preprocessing example是我们要归一化的数据nscaler = preprocessing.StandardScaler().fit(example)n print(scale...
tensorflow调参总结(不断更新中)
slim batch norm fine tune
用sklearn和tensorflow做boston房价的回归计算的比较(3)--RNN之递归神经网路LSTM
在tensorflow里RNN才是做回归计算的正规军,其中LSTM更是让人工智能有了记忆,如果cnn最适合做的是图像识别,那么LSTM就是视频识别。 网上的教程多是用正余弦数据在做预测,输入输出都是一维,我这用波士顿房价,输入是13个特征!
认识tensorflow-自模拟一个线性回归预测
import tensorflow as tfrnimport osrnos.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # 不显示警告rnrnrndef myregression():rn '''rn 自实现一个线性回归预测rn :return:Nonern '''rnrn # 变量作用域,使代码更加清晰,graph也更加清晰rn with tf.va...
训练loss不下降原因集合
一,train loss与test loss结果分析4666train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,test loss趋于不变,说明网络过拟合;train loss 趋于不变,test loss不断下降,说明数据集100%有问题;train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数...
TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)
TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)nn这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文,介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间,GPU下可能需要 2weeks ,如果是浦东(普通)的笔记本,天呢,估计需要一年的时间(当然夸张了,一个月的时间还是需要的,根据美国team看 需要的时间大约是gup 时间...
tensorflow中导入相同模型,每次传入图片的输出预测值不一样(预测值差很多)
产生问题原因:导入模型后,传入神经网络的dropout=1.0未生效。故原网络中的dropout默认值=0.9生效,所以每次运行就会dropout掉一些神经元,所以每次输出结果肯定不一样。n为何传入dropout=1.0未生效,解决如下:ntensorflow导入模型有很多方法,其中有两种方式:nn这种方法虽简单,但是要在代码中重新写出训练网络的结构(该方法要写在重写的网络结构之后)nn①将已经定...
记记关于tensorflow训练模型时出现损失函数为NAN问题
交叉熵损失函数输出NAN的问题:rn之前使用tensorflow训练模型,开始的一段迭代周期,模型的预测准确率一直在上升,徘徊一段时间后,准确率骤减,直至到随机猜测的水平,开始以为是模型出了问题,就修改了一下代码,记录训练过程中的误差,希望通过误差曲线,分析是否模型的问题。结果绘图出错,将损失数组输出看了一下,发现后期的损失值都是0。在网上查询,发现是损失函数的特性造成的,在交叉熵损失函数中,会计
loss超大,训练一次后loss为nan
因为网络中间某变量为计算后产生的巨大的数,因为根本忘记过sigmoid就参与loss计算所致
loss收敛过小或finetune时跑飞情况分析
   最近在跑REDNet去噪网络,基于pytorch框架,输入输出图像被归一化到了0-1之间,loss使用的是L2 loss,理论最终收敛值为33左右。结果在之前训练好模型的基础上finetune,出现了这种情况: n n nnn   当使用L1或者输入为0-255时,并没有出现这种情况。这里使用L2 loss,输入0-1之间,loss先下降,再上升,这是很反常的,一般来说有以下问题导致...
如何使用学习曲线来诊断你的LSTM模型的行为?(附代码)
AMiner学术头条原创nn2019/03/11 14:32nn邵洲作者nn如何使用学习曲线来诊断你的LSTM模型的行为?(附代码)nnnnnnnnnLSTM是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。nn《Long Short Term Memory Networks with Pytho...
记录模型训练时loss值的变化
n 记录训练过程中的每一步的loss变化 n if verbose and step % verbose == 0:n sys.stdout.write('\r{} / {} : loss = {}'.format(n step, total_steps, np.mean(total_loss)))n sys.stdout.flus...
使用LSTM进行时间序列预测
用 LSTM 做时间序列预测的一个小例子,详情见我滴博文。
LSTM算法+数据预测
       传统的神经网络一般都是全连接结构,且非相邻两层之间是没有连接的。对输入为时序的样本无法解决,因此引入了RNN(可以查看具体的RNN含义和推导),但是会存在梯度消失(不同的隐层之间会存在过去时刻对当前时刻的影响因素,但随着时间跨度的变大这种影响会削弱)。因此引入LSTMnn1 LSTM算法小结n    LSTM:是对RNN算法的改进,通过不同三个门控制之前信息对当前信息的影响即(1:那...
TensorFlow神经网络模型不收敛的处理
1、learning rate设大了0.1~0.0001.不同模型不同任务最优的lr都不一样。我现在越来越不明白TensorFlow了,我设置训练次数很大的时候,它一开始就给我“收敛”到一个值,后面的值都一样。2、归一化参考:rn深度学习收敛问题;rn训练深度神经网络
在MATLAB 2018中用深度学习进行时间序列预测
<本文翻译自matlab帮助文档,算是自己对该方法的一点理解和总结>n本例展示了如何用LSTM网络预测时间序列数据。为了预测一个序列的未来时间步长值,你可以训练一个sequence-to-sequence LSTM回归网络,其中[2]网络的响应是训练序列值移动了一个时间步长。也就是说,在输入序列的每个时间步长上,LSTM网络学习去预测下个时间步长的值。为了预测未来多个时间[2]步长的值...
文章热词 颜色模型 机器学习教程 Objective-C培训 交互设计视频教程 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 价格预测机器学习模型 java大佬的学习经验