python基于EEMD-LSTM的光伏功率预测，预测结果误差很大

python基于EEMD-LSTM的光伏功率预测结果误差很大的问题：
采用常见的数据分解算法+深度学习模型的方式进行光伏功率预测，先对光伏历史功率数据进行EEMD分解，分解结果如下图1所示：

图1

对每一个IMF分量分别建立LSTM模型进行预测，然后将各子序列的预测结果相叠加，得到最终的预测结果，预测值与实际值的曲线如下图2所示：

图2

可以看出，预测值的发展趋势和实际值基本吻合，但普遍比实际值高一些，也就是说，预测结果曲线在实际值曲线上方，这是怎么回事，该怎么解决？
代码如下：

#导入数据
import pandas as pd
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_absolute_percentage_error

df = pd.read_excel(r"C:/Users/ASUS/Desktop/光伏功率数据/国能日新光伏功率数据/测试.xlsx")
df
df = df.fillna(0)
signal = df["实际功率"].values

#EEMD分解
from PyEMD import EEMD
import numpy as np
import matplotlib.pyplot as plt
# 使用EEMD进行信号分解

eemd = EEMD()
eemd(signal)
imfs, res = eemd.get_imfs_and_residue()



# 可视化分解后的IMFs

plt.figure(figsize=(12, 20))

for i in range(imfs.shape[0]):

    plt.subplot(imfs.shape[0] + 1, 1, i+1)

    plt.plot(imfs[i, :])

    plt.title(f'IMF {i+1}')



# 可视化剩余部分

plt.subplot(imfs.shape[0] + 1, 1, imfs.shape[0] + 1)

plt.plot(res)

plt.title('Residue')


plt.tight_layout()

plt.show()

#信号合并
sig_df = pd.DataFrame(imfs.T)
# sig_df[10] = residue
sig_df
seq_length = 7
x = df[["实际功率"]].values

#xy = xy[:2265, :]
y = df[["实际功率"]].values  # label

# build a dataset
dataX = []
dataY = []
for i in range(0, len(y) - seq_length):
    _x = x[i:i + seq_length]
    _y = y[i + seq_length]  # Next close price
    print(_x, "->", _y)
    dataX.append(_x)
    dataY.append(_y)

# In[6]:
train_size = int(len(dataY) * 0.8)
test_size = len(dataY) - train_size
trainX, testX = np.array(dataX[0:train_size]), np.array(dataX[train_size:len(dataX)])
trainY, testY = np.array(dataY[0:train_size]), np.array(dataY[train_size:len(dataY)])

na, nb, nc = trainX.shape
trainX = trainX.reshape(na, nb * nc)
na, nb, nc = testX.shape
testX = testX.reshape(na, nb * nc)

#分解算法
def get_train_test(x, y):
  # build a dataset
    dataX = []
    dataY = []
    for i in range(0, len(y) - seq_length):
        _x = x[i:i + seq_length]
        _y = y[i + seq_length]  # Next close price
        #         print(_x, "->", _y)
        dataX.append(_x)
        dataY.append(_y)

    # In[6]:
    train_size = int(len(dataY) * 0.8)
    test_size = len(dataY) - train_size
    trainX, testX = np.array(dataX[0:train_size]), np.array(dataX[train_size:len(dataX)])
    trainY, testY = np.array(dataY[0:train_size]), np.array(dataY[train_size:len(dataY)])

    na, nb, nc = trainX.shape
    trainX = trainX.reshape(na, nb * nc)
    na, nb, nc = testX.shape
    testX = testX.reshape(na, nb * nc)

    return trainX, trainY, testX, testY

#LSTM
from keras.models import Sequential
from keras.layers import LSTM, Dense
import sklearn.linear_model as lm

cols = sig_df.columns
all_pred = []

for col in cols:
    x = sig_df[[col]].values
    y = sig_df[[col]].values  # label
    sig_trainX, sig_trainY, sig_testX, sig_testY = get_train_test(x, y)

    # 将数据集重塑为符合LSTM输入要求的形状
    sig_trainX = np.reshape(sig_trainX, (sig_trainY.shape[0], seq_length, 1))

    # 构建LSTM模型
    model = Sequential()
    model.add(LSTM(units=63, input_shape=(sig_trainX.shape[1], 1)))
    model.add(Dense(units=1))
    model.compile(optimizer='adam', loss='mean_squared_error')

    # 训练模型
    model.fit(sig_trainX, sig_trainY, epochs=10, batch_size=36, verbose=2)

    predictions = model.predict(sig_testX)

    all_pred.append(predictions)
all_pred_final = np.array(all_pred).sum(axis=0)
mse = mean_squared_error(testY, all_pred_final)
rmse = mse ** 0.5
mae = mean_absolute_error(testY, all_pred_final)
mape = mean_absolute_percentage_error(testY, all_pred_final)

print('MSE: %.5f' % mse)
print('RMSE: %.5f' % rmse)
print('MAPE: %.5f' %mape)
print('MAE: %.5f' % mae)

plt.rcParams['font.sans-serif']=['SimHei'] #黑体
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(10, 5))

plt.plot(testY, label='实际值')

plt.plot(all_pred_final, color='red', label='预测值')
plt.legend()
plt.show()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-09 21:54
关注
引自免费微信小程序：皆我百晓生。

优化模型参数，尝试不同的特征选择或使用预处理技术如归一化，调整EEMD分解层数和IMF数量，或者考虑结合其他预测方法降低误差。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比
2025-04-29 12:40

matlab科研助手的博客时间序列预测是数据分析领域的一个重要课题，在金融、气象、能源、交通等诸多领域具有广泛的应用价值。传统的统计学方法，如ARIMA、指数平滑等，在处理线性和平稳时间序列方面表现良好，然而面对复杂非线性、非平稳...
负荷预测基于CEEMDAN-LSTM的负荷预测研究（Python代码实现）
2025-11-19 05:55

【负荷预测】基于CEEMDAN-LSTM的负荷预测研究（Python代码实现）内容概要：本文介绍了基于CEEMDAN-LSTM的负荷预测研究，结合Python代码实现，提出一种用于电力负荷时间序列预测的混合模型。该模型首先利用完备集合...
基于VMD-SSA-LSTM的多维时序光伏功率预测
2023-06-01 10:09

电力程序小学童的博客之前分享了预测的程序，该程序预测效果比较好，并且结构比较清晰，但是仍然有同学咨询混合算法的预测，本次分享基于VMD-SSA-LSTM的多维时序光伏功率预测，本程序参考文章《基于VMD-SSA-LSSVM的短期风电预测》和...
【负荷预测】基于CEEMDAN-CNN-LSTM的负荷预测研究附Python代码
2025-05-24 06:55

Matlab大师兄的博客传统的负荷预测方法，无论是基于统计学模型（如ARIMA、指数平滑）还是简单的机器学习模型（如SVM、决策树），在处理复杂、非线性和多变的电力负荷数据时，往往难以捕捉其深层特征和动态演变规律。
基于transformer-bilstm光伏功率预测模型详解及代码复现
2025-01-07 20:21

清风AI的博客在探讨基于Transformer-BiLSTM的光伏功率预测模型之前，我们需要了解这一研究领域的背景。近年来，随着光伏发电技术的快速发展和大规模应用，
【风电功率预测】经验模态分解优化长短时记忆网络EMD-LSTM风电功率预测【含Matlab源码 1402期】
2023-02-11 12:20

Matlab领域的博客经验模态分解优化长短时记忆网络EMD-LSTM风电功率预测完整代码和数据，方可运行；数据可直接替换，适合小白！可提供运行操作视频！
【负荷预测】基于VMD-CNN-BiLSTM的负荷预测研究附Python代码
2025-05-09 15:48

Matlab机器学习之心的博客电力负荷预测是电力系统规划、调度、运行和交易中...为了提高负荷预测的精度和鲁棒性，本文提出了一种基于变分模态分解（VMD）、卷积神经网络（CNN）和双向长短期记忆网络（BiLSTM）的组合预测模型（VMD-CNN-BiLSTM）。
灰狼优化算法（GWO）与长短期记忆网络（LSTM）结合的预测模型（GWO-LSTM）及其Python和MATLAB实现
2024-08-03 20:23

追蜻蜓追累了的博客在现代数据科学和人工智能领域，预测模型的准确性和效率是研究者和工程师不断追求的目标，尤其是在时间序列预测、金融市场分析、气象预测等领域。在标准RNN中，信息的传播依赖于隐藏状态，而在LSTM中，引入了记忆...
【CEEMDAN-WOA-LSTM】完备集合经验模态分解-鲸鱼优化-长短时记忆神经网络研究附Python代码
2025-05-21 09:34

Matlab大师兄的博客为了应对这些难题，本文提出了一种基于完备集合经验模态分解（CEEMDAN）、鲸鱼优化算法（WOA）和长短时记忆神经网络（LSTM）的集成预测模型（CEEMDAN-WOA-LSTM）。该模型首先利用CEEMDAN对原始复杂时间序列进行分解...
【VMD-LSTM】变分模态分解-长短时记忆神经网络研究附Python代码
2025-04-30 16:24

Matlab大师兄的博客随着大数据时代的到来和复杂系统建模需求的日益增长，对时间序列数据进行准确的预测与分析已成为众多学科领域的关键挑战。传统的时序分析方法往往难以有效捕捉数据中的非线性、非平稳以及多尺度特征。近年来，基于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月9日

python基于EEMD-LSTM的光伏功率预测，预测结果误差很大

4条回答 默认 最新

问题事件

4条回答默认最新