神经网络是否过拟合、怎么提高预测能力

请问一下大家，神经网络训练得到如下图的结果应该不是过拟合吧，数据是表格数据，数据量大约9万多，按照训练集、验证集、测试集8:1:1设置

测试集的结果为：
Test Loss=0.000760476
Test Accuracy=0.987340391
Test RMSE=0.027576728
Test MAE=0.016078779

但是使用神经网络来对新数据进行预测的结果并不是很理想，如下图，新数据量大约2万多

指标结果如下
Mean Squared Error (MSE)=22.92607648
Root Mean Squared Error (RMSE)=4.788118261
Mean Absolute Error (MAE)=2.503658454
R-squared (R2)=0.621191652
想问问大家是什么原因，也想了解一下如何提高神经网络对新数据的预测能力，谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-19 17:23

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

问题分析：通过训练集和测试集的结果来看，模型的训练效果已经很不错了，但是对于新数据的预测却不理想，可能有以下可能原因： 1.训练集和测试集的数据与新数据之间有较大的差异性，可能存在数据偏差，导致模型无法准确预测新数据。 2.模型过拟合训练集和测试集，但是无法泛化到新数据上。提高神经网络对新数据的预测能力的方法： 1.增加训练数据集的种类和数量，使模型具有更好的泛化能力。 2.对数据进行预处理，如归一化、标准化、降噪等处理方式。 3.使用更加高效的算法或模型结构，如卷积神经网络(CNN)、循环神经网络(RNN)等。 4.对模型进行超参数调优，如学习率、正则化系数等。 5.使用集成学习方法，如Bagging、Boosting等。 6.使用迁移学习方法，在原模型的基础上进行迁移学习，使得模型对新数据的预测能力更强。案例：针对上述问题分析及提高预测能力的方法，以下提供一个简单的案例，使用Keras深度学习框架训练模型并使用迁移学习方法提高模型的泛化能力。

# 导入所需库
from keras.applications import VGG16
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dense, Flatten, Dropout
from keras.optimizers import Adam
# 定义VGG16模型
base_model = VGG16(weights="imagenet", include_top=False, input_shape=(150, 150, 3))
# 冻结卷积层参数
for layer in base_model.layers:
    layer.trainable = False
# 定义增强器
train_data = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    validation_split=0.2
)
# 加载训练集和验证集
train_set = train_data.flow_from_directory(
    'train',
    target_size=(150, 150),
    batch_size=32,
    shuffle=True,
    seed=42,
    class_mode='binary',
    subset='training'
)
validation_set = train_data.flow_from_directory(
    'train',
    target_size=(150, 150),
    batch_size=32,
    shuffle=True,
    seed=42,
    class_mode='binary',
    subset='validation'
)
# 定义新的神经网络模型
model = Sequential()
# 添加VGG16卷积层
model.add(base_model)
# 添加全局平均池化层
model.add(Flatten())
# 添加Dropout层
model.add(Dropout(0.5))
# 添加Dense层
model.add(Dense(units=128, activation='relu'))
# 添加输出层
model.add(Dense(units=1, activation='sigmoid'))
# 编译模型
model.compile(optimizer=Adam(lr=0.001), loss='binary_crossentropy', metrics=['accuracy'])
# 训练模型
history = model.fit_generator(
    train_set,
    epochs=100,
    validation_data=validation_set
)
# 对新数据进行预测
test_data = ImageDataGenerator(rescale=1. / 255)
test_set = test_data.flow_from_directory(
    'test',
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary'
)
model.evaluate_generator(test_set)
# 使用迁移学习方法提高模型预测能力
# 解除卷积层的冻结，重新训练模型
for layer in base_model.layers:
    layer.trainable = True
model.compile(optimizer=Adam(lr=0.001), loss="binary_crossentropy", metrics=["accuracy"])
history = model.fit_generator(
    train_set,
    epochs=50,
    validation_data=validation_set
)
# 对新数据进行预测，评估模型性能
model.evaluate_generator(test_set)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
训练精度和测试精度相差2%是过拟合吗？深度学习目标检测神经网络
2022-10-18 16:20

回答 2 已采纳 1.7%也不算多啊，数据集小一些或者数据集分布偏差点就这样了是否还是得看loss曲线或acc曲线来判断。比如训练集loss不断下降，验证集先下降后上升，就是经典的过拟合现象；或者验证集的loss基本上
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
Desktop.zip_seenpis_成绩预测_神经网络_神经网络拟合
2022-07-14 12:46

标题“Desktop.zip_seenpis_成绩预测_神经网络_神经网络拟合”暗示了这是一个关于使用神经网络进行成绩预测的项目，其中可能包含了神经网络拟合的实现。描述中提到的“神经网络拟合曲线，包括对任意函数曲线的训练，...
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
怎么把神经网络工具箱里的示例数据导出啊机器学习深度学习神经网络
2022-04-15 16:37

回答 1 已采纳在NEXT，到下图中保存数据的界面保存结果，在matlab的workplace中就有这几个参数啦，我们就可以进行使用。
神经网络每一层做了什么？机器学习神经网络计算机视觉
2022-11-27 20:43

回答 3 已采纳个人理解：从数学的角度，就是拟合函数。足够深的神经网络可以拟合出几乎任意的函数以一层为例：输入n维，输出m维 -- 可以理解成拟合了m个函数每个函数输入n个变量最后：建议手撕代码，理解更深刻
基于matlab的神经网络回归拟合红外光谱的汽油辛烷值预测系统设计与实现
2022-05-01 10:53

在本项目中，“基于MATLAB的神经网络回归拟合红外光谱的汽油辛烷值预测系统设计与实现”是一项利用现代机器学习技术进行化学物质属性预测的实例。MATLAB是一种强大的数学计算和数据分析环境，特别适合于构建和训练...
vgg19训练图像分类，分成两类，这样训练出来的网络是否过拟合了？人工智能机器学习深度学习
2021-03-23 15:58

回答 3 已采纳 1k5左右就差不多了，过拟合的话不一定，要看下有没有防止过拟合的手段，如果你的项目是开源项目的话，一般会有这方面的限制的。
关于#神经网络#的问题：自己猜测是因为模型太复杂过拟合了，怎么解决weka过拟合算法
2022-12-31 00:28

回答 9 已采纳一种解决过拟合的方法是使用正则化。正则化通过限制模型的复杂度来减少过拟合的风险。在weka中，可以使用训练算法的“-R”参数来设置正则化系数。例如，使用命令“java weka.classifiers
bp神经网络怎么预测未来七天的数据值 matlab 有问必答
2023-02-18 14:48

回答 2 已采纳这篇博客: 基于灰狼优化的BP神经网络（预测应用） - 附代码中的 4.测试结果：部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读: 从灰狼算法的收敛曲线可以看到，整体误差是不断
优化算法+机器学习+神经网络+遗传算法+matlab编程
2024-01-26 09:41

对于未知的非线性函数，仅仅通过函数的输入和输出数据难以寻找函数极值，这一类问题可以通过神经网络结合遗传算法求解，利用神经网络的非线性拟合能力和遗传算法的非线性寻优能力寻找函数极值。神经网络训练拟合根据...
用keras 实现的resnet，但是训练下来过拟合严重，请问怎么加入正则化？ tensorflow 人工智能机器学习深度学习神经网络
2019-01-02 15:55

回答 1 已采纳直接写在卷积层的参数里 https://keras.io/zh/regularizers/
神经网络过拟合解决方法,神经网络过拟合现象
2022-10-05 18:40

wenangou的博客简介人工神经网络按其模型结构大体可以分为前馈型网络（也称为多层感知机网络）和反馈型网络（也称为Hopfield网络）两大类，前者在数学上可以看作是一类大规模的非线性映射系统，后者则是一类大规模的非线性动力学...
MATLAB实现BP神经网络时间序列预测（完整源码和数据）
2022-10-19 12:49

标题中的“MATLAB实现BP神经网络时间序列预测”是指使用MATLAB编程语言，构建并运行一个基于BP（Backpropagation）神经网络的模型，来对时间序列数据进行预测。BP神经网络是一种广泛应用的人工神经网络，它通过反向...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月19日

悬赏问题

¥15 想要写一个跟百度网盘一样文件管理器，打开全部文件夹后，一级一级返回
¥15 悬赏Python-playwright部署在centos7上
¥15 psoc creator软件有没有人能远程安装啊
¥15 快速扫描算法求解Eikonal方程咨询
¥20 我的是道格手机，重置后屏幕右上角出现红色字的未写入tee key 和未写入google key请问怎么去掉啊
¥30 关于R语言运行分区生存模型中的问题！
¥15 校内二手商品转让网站
¥20 高德地图聚合图层MarkerCluster聚合多个点，但是ClusterData只有其中部分数据，原因应该是有经纬度重合的地方点，现在我想让ClusterData显示所有点的信息，如何实现？
¥100 求Web版SPC控制图程序包调式
¥20 指导如何跑通以下两个Github代码

神经网络是否过拟合、怎么提高预测能力

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新