如何防止过拟合？为何我的训练准确率高，但是测试准确率很低？

问题如标题
print('Training ------------')

training the model

model.fit(X_train, y_train, epochs=8, batch_size=32,)

Epoch 1/8
19578/19578 [==============================] - 334s 17ms/step - loss: 1.9936 - acc: 0.3272
Epoch 2/8
19578/19578 [==============================] - 325s 17ms/step - loss: 1.3145 - acc: 0.5698
Epoch 3/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.9667 - acc: 0.6897
Epoch 4/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.7580 - acc: 0.7557
Epoch 5/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.5882 - acc: 0.8095
Epoch 6/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.4548 - acc: 0.8510
Epoch 7/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.3471 - acc: 0.8839
Epoch 8/8
19578/19578 [==============================] - 325s 17ms/step - loss: 0.2524 - acc: 0.9176

print('\nTesting ------------')

Evaluate the model with the metrics we defined earlier

loss, accuracy = model.evaluate(X_test1, y_test1)

print('\ntest loss: ', loss)
print('\ntest accuracy: ', accuracy)

Testing ------------
3000/3000 [==============================] - 16s 5ms/step

test loss: 15.392780853271484

test accuracy: 0.045

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
b1044339259 2019-07-26 12:51
关注
首先一点，我习惯讲问题，很啰嗦。因为我想把问题讲的连之前不知道的人都可以清楚明白。你不介意就继续看吧。
第一个：我们训练模型其实在做什么。
神经网络模型本质就是一个算法，一个组合的算法。我们训练神经网络其实是在调参，让这个算法符合我们想要的效果。
第二个：什么是过拟合
网络调参是依据样本去调整算法。当我们根据样本调参出来的算法太过符合样本时，就对新数据效果不好。比如我分辩是不是狗。我样本都是二哈，这样调整的网络参数都是二哈的。现在识别新数据——金毛，就会识别金毛不是狗。
这就是过拟合。调出来的参数太符合样本了。
第三个：解决方法
过拟合就是参数调的太符合样本，所以解决的方法就有两方面
1.样本。原本样本只有二哈的，导致参数符合二哈，现在增加样本种类和大小，这样参数调整出来就符合更多狗的。
2.参数。让参数调整的没那么好。这就衍生出正则化、dropout等方法。正则化就是在loss函数加一项，这样出来的参数就有那一项的影响，不会太符合样本特征了。
dropout就是在每次迭代训练时随机丢一些单元，这次不参与，这样每次模拟的就不是基于全部，出来的参数就不会太符合样本了。
其实无论哪种方法都是基于参数调整方面出发。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 17

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【问题解决】训练和验证准确率很高，但测试准确率很低
2022-08-09 06:13

ifsun-的博客采用ResNet50预训练模型训练自己的图像分类模型。训练和验证阶段准确率很高，但随机输入一张图片时，大多数情况下依旧预测得不准确。
训练准确率100%，测试准确率只有50%？？
2024-10-21 08:44

bug菌¹的博客你面临的主要问题可能是过拟合、数据不一致性或计算准确率时的逻辑问题。通过增加正则化、确保数据处理一致性、合理选择阈值等方式，可以帮助你提升模型的泛化能力和准确率。希望如上措施及解决方案能够帮到有需要的...
Llama-Factory训练过程中如何防止过拟合？
2025-12-12 10:55

易个小小钡原子的博客本文介绍Llama-Factory如何通过LoRA、QLoRA、正则化、早停机制与数据增强等技术协同防止大模型微调中的过拟合，尤其适用于小样本场景，提升模型泛化能力。
【AI概念】泛化能力（Generalization）详解 | 训练准确率 vs 测试准确率（附详尽Python代码演示）|定义、数学表达、影响因素、实际意义、三者的关系与工程实践建议|典型案例与可视化
2025-06-29 17:51

人工智能AI酱的博客本篇将会系统讲解机器学习中三个密切相关但常被混淆的核心概念：泛化能力（Generalization Ability）、训练准确率（Training Accuracy）与测试准确率（Testing Accuracy）。内容包括定义、数学表达、影响因素、实际...
softmax回归遇到的训练集准确率小于测试集准确率的问题
2025-03-16 15:15

郭岂凡的博客在训练初期，模型可能在某些batch中表现较差（尤其是初始batch），导致训练集整体准确率被拉低。），模型逐渐适应训练数据，训练集准确率会稳步提升并超过测试集。模型在初始阶段可能对训练数据欠拟合，而测试集的...
batch_size是否导致过拟合？学习率？
2024-07-25 16:52

不搞计算机不是好侦探的博客是机器学习模型在训练数据上表现很好，但在测试或验证数据上表现较差的一种现象。它表明模型过于复杂，以至于捕捉到了训练...过拟合模型在训练数据上的误差很低，但在新数据上的误差较高，无法有效泛化到未见过的数据。
MATALB创建LSTM，训练集精度高但是测试集精度很低是什么原因？
2022-04-05 15:28

素质教育漏网之鱼397的博客但是在训练过程中训练进度显示准确度已经达到100左右，但是测试精度只有50%。为了控制变量我甚至使用了相同的训练集和测试集，效果依然不一样。请问是什么问题呢？网络部分参考下文： // =====================...
【机器学习300问】17、什么是欠拟合和过拟合？怎么解决欠拟合与过拟合？
2024-01-24 22:04

小oo呆的博客什么是欠拟合和过拟合？造成欠拟合与过拟合的可能原因？怎么解决欠拟合与过拟合问题？
深度学习，训练集准确率高，但验证集准确率一直不上升，很低的问题
2025-01-06 14:48

开心邮递员的博客在训练过程中，训练集的准确率稳步上升，但是验证集的准确率一直在40%左右徘徊，从网上搜索可能的原因有： 1、学习率太小，陷入局部最优。 2、数据量太小（4000多条数据，应该还可以吧） 3、训练集和测试集数据...
基于机器学习的识别准确率不高问题
2024-04-13 00:00

努力の小熊的博客在解决准确率不高的问题时，需要对以上各方面进行综合考虑和调整，以提高模型的性能和预测准确率。某些类别的样本过多，而其他类别的样本过少，可能导致模型偏向于预测样本量较多的类别。若选择的模型不适合解决特定...
没有解决我的问题, 去提问

如何防止过拟合？为何我的训练准确率高，但是测试准确率很低？

training the model

Evaluate the model with the metrics we defined earlier

2条回答 默认 最新

2条回答默认最新