tensorflow CNN训练mnist数据集后识别自己写的数字效果不好
自己搭建的cnn,用mnist数据集训练的模型,准确率大概在97%,但是用手机拍了几张手写照片,灰度化之后用模型测试发现效果很差。。。0给认成了8,不知道为什么,有没有遇到类似问题的朋友
模型参考的tensorflow 1.0 学习:用CNN进行图像分类 - denny402 - 博客园
https://www.cnblogs.com/denny402/p/6931338.html
MNIST数据集与你自己采集的图像,实际上是两个不同的数据集,你在MNIST上训练,然后在你的数据集上测试,测试性能不好是十分正常的。这实际上涉及在两个相似但是不同的域之间的迁移学习的问题。有三个办法解决你的问题:
1、对你自己的数据集进行正确的归一化,包括裁剪、平移、缩放、二值化等,让它们至少看起来与MNIST数据集中的图像类似,这样识别率会改善。
2、先在MNIST上训练你的CNN模型(预训练),再用你自己的数据集进行训练(精调),一般也可以获得识别率的提升;
3、如果想获得更高的识别率,建立自己的大规模数据集(规模与MNIST相当),然后直接训练。
这是很正常的,mnist是一个非常“理想”的数据集,它的每个数字大小都差不多,都位于图像的中间,灰度和粗细都适当。
你取得了很好的识别效果,说明你的训练过拟合(over fitting)了而已。这种训练不能说明什么。
当然,你做一个dropout可能会减少过拟合,但是要知道,mnist本身的识别看似容易,但是会让你产生错觉。
MNIST 只是相当于你初学代码 printf“hello world”,如果你想用这个数据集训练出来的模型来达到你实用未免有些天真
一开始我不知道是图片的问题,后来我在电脑上输入数字,然后截图(数字要在截图的正中央),发现代码是能正确识别截图的