tensorflow CNN训练mnist数据集后识别自己写的数字效果不好

自己搭建的cnn,用mnist数据集训练的模型,准确率大概在97%,但是用手机拍了几张手写照片,灰度化之后用模型测试发现效果很差。。。0给认成了8,不知道为什么,有没有遇到类似问题的朋友
模型参考的tensorflow 1.0 学习:用CNN进行图像分类 - denny402 - 博客园
https://www.cnblogs.com/denny402/p/6931338.html

4个回答

MNIST数据集与你自己采集的图像,实际上是两个不同的数据集,你在MNIST上训练,然后在你的数据集上测试,测试性能不好是十分正常的。这实际上涉及在两个相似但是不同的域之间的迁移学习的问题。有三个办法解决你的问题:

1、对你自己的数据集进行正确的归一化,包括裁剪、平移、缩放、二值化等,让它们至少看起来与MNIST数据集中的图像类似,这样识别率会改善。

2、先在MNIST上训练你的CNN模型(预训练),再用你自己的数据集进行训练(精调),一般也可以获得识别率的提升;

3、如果想获得更高的识别率,建立自己的大规模数据集(规模与MNIST相当),然后直接训练。

这是很正常的,mnist是一个非常“理想”的数据集,它的每个数字大小都差不多,都位于图像的中间,灰度和粗细都适当。
你取得了很好的识别效果,说明你的训练过拟合(over fitting)了而已。这种训练不能说明什么。
当然,你做一个dropout可能会减少过拟合,但是要知道,mnist本身的识别看似容易,但是会让你产生错觉。

caozhy
贵阳老马马善福专业维修游泳池堵漏防水工程 回复qq_28254507: tf内置了dropout
2 年多之前 回复
qq_28254507
ProgJ 谢答,那怎么样能改善模型呢,通过dropout减少过拟合么?还有没有什么比较有效的处理?
2 年多之前 回复

MNIST 只是相当于你初学代码 printf“hello world”,如果你想用这个数据集训练出来的模型来达到你实用未免有些天真

一开始我不知道是图片的问题,后来我在电脑上输入数字,然后截图(数字要在截图的正中央),发现代码是能正确识别截图的

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问