用CNN卷积神经网络识别手写数字（MNIS 厂数据集）

本人刚入门。对于这类问题没有解决的思路，希望能求得专业人士的解答。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-05-28 21:02

关注

这篇博客: mnist手写数字体识别CNN训练测试完美复现，以及自己手写数字进行测试中的 1、mnist数据集介绍 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

这个数据集是来自美国国家标准与技术研究所, National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员. 测试集(test set) 也是同样比例的手写数字数据。

为什么要找这么多人来写呢？就是要增强学习结果的泛化能力，避免最后只认识某几个人的手写体。

import pylab
print('训练数据：',data.train.images)
print('训练集尺寸：',data.train.images.shape)
print('训练集标签尺寸：',data.train.labels.shape)
print('测试集尺寸：',data.test.images.shape)
print('测试集标签尺寸：',data.test.labels.shape)
'''
回归：
训练数据： [[0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]]
训练集尺寸： (55000, 784)
训练集标签尺寸： (55000, 10)
测试集尺寸： (10000, 784)
测试集标签尺寸： (10000, 10)
'''

可以看到，在这个数据集中，训练集一共有55000个图片，存放在一个矩阵数组中，每一行是一个图片。测试机一共有10000个图片。他们对应的标签就是one_hot编码，例如数字0的标签是1000000000，数字1的标签是0100000000，以此类推。

打印几张mnist中的图片来看一下：

import pylab
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
DATA_DIR = 'MNIST_data'
data = input_data.read_data_sets(DATA_DIR, one_hot=True)
pylab.figure(figsize=(10,10))
for i in range(10): 
    im = data.train.images[i]
    im = im.reshape((28,28))
    pylab.imshow(im)
    pylab.show()
im

在这里插入图片描述
这个数字。。。有的连我自己都不认识。

每一个图片是这样保存的，都是一个28*28的数组。
在这里插入图片描述

以下回答由chatgpt基于相关博客总结生成:

首先，感谢您对CNN卷积神经网络的学习和使用，下面是我对该问题的解答和建议：

数据集首先需要下载MNIST数据集，可以使用TensorFlow提供的API进行下载，也可以到官网进行下载。下载完毕后可以采用TensorFlow提供的读取程序对数据集进行读取操作。
模型设计 CNN模型的设计主要包括卷积层、池化层、全连接层和输出层。这里建议使用TensorFlow框架，可以参考TensorFlow官网提供的样例进行操作。
模型训练对于模型训练，可以采用TensorFlow提供的优化器进行梯度下降的计算。同时也需要对训练集和测试集进行分离，可以采用随机打乱的方式进行。
模型评估在模型评估方面，可以采用测试集对训练好的模型进行评估和检验，主要包括准确率、精确率和召回率等指标，可以使用confusion_matrix函数进行计算。
代码实现对于代码实现方面，在TensorFlow框架下可以采用以下代码进行实现：

# 导入相关包
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 读取MNIST数据集
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

# 设计卷积神经网络模型
x = tf.placeholder(tf.float32, [None, 784])
y_true = tf.placeholder(tf.float32, [None, 10])

x_reshape = tf.reshape(x, [-1, 28, 28, 1])
conv1 = tf.layers.conv2d(inputs=x_reshape, filters=32, kernel_size=[5, 5], padding="same", activation=tf.nn.relu)
pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)
conv2 = tf.layers.conv2d(inputs=pool1, filters=64, kernel_size=[5, 5], padding="same", activation=tf.nn.relu)
pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)
pool2_flat = tf.reshape(pool2, [-1, 7 * 7 * 64])
dense = tf.layers.dense(inputs=pool2_flat, units=1024, activation=tf.nn.relu)
dropout = tf.layers.dropout(inputs=dense, rate=0.4)
y_pred = tf.layers.dense(inputs=dropout, units=10)

# 定义损失函数
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits = y_pred, labels = y_true))

# 定义优化器进行梯度下降计算
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

# 评估模型准确率
correct_prediction = tf.equal(tf.argmax(y_pred, 1), tf.argmax(y_true, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 训练模型并测试模型准确率
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(2000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict = {x: batch_xs, y_true: batch_ys})
        if i % 100 == 0:
            acc = sess.run(accuracy, feed_dict = {x: batch_xs, y_true: batch_ys, keep_prob: 1.0})
            print("step %d, training accuracy %g" % (i, acc))

    # 对模型进行测试
    test_acc = sess.run(accuracy, feed_dict = {x: mnist.test.images, y_true: mnist.test.labels})
    print("test accuracy %g" % test_acc)

希望对您有所帮助，如有任何疑问可随时在评论区提出，感谢您的阅读。

报告相同问题？

关注问题

卷积神经网络实现mnist手写识别
2019-02-14 15:03

卷积神经网络（CNN，Convolutional Neural Network）是一种深度学习模型，特别适用于处理具有网格状结构的数据，如图像。在本案例中，我们将利用CNN实现MNIST手写数字识别，MNIST是一个广泛用于训练机器学习和深度...
卷积神经网络（CNN）实现mnist手写数字识别学习
2022-08-04 14:51

小白冲冲冲·的博客学习最简单的CNN模型 -- LeNet-5
书写数字识别+训练方法+mnist数据集
2021-08-27 14:48

此外，为了进一步提升识别精度，可以尝试其他机器学习或深度学习方法，如支持向量机（SVM）、神经网络（尤其是卷积神经网络CNN），这些在MNIST上表现更出色。不过，对于初学者来说，KNN是一个简单易懂的起点。总结...
pytorch 实战二 CNN手写数字识别
2025-06-13 18:51

四川兔兔的博客本文介绍了使用PyTorch实现手写数字识别任务的全过程。主要内容包括：使用torchvision.datasets加载MNIST数据集，并利用DataLoader进行分批处理；构建基于Sequential的CNN网络结构，包含卷积层、BatchNorm和全...
机器学习实战 | MNIST手写数字分类项目（深度学习初级）
2023-07-10 15:23

lovetaozibaby的博客准备写个系列博客介绍机器学习实战中的部分公开项目。首先从初级项目开始。本文为初级项目第二篇：利用MNIST数据集训练手写数字分类。。机器学习实战 | emojify 使用Python创建自己的表情符号（深度学习初级）
从头到尾实现一个深度学习项目——MNIST 手写数字识别系统
2023-08-09 04:16

光子AI的博客 MNIST数据集是手写数字图片数据集，由来自NIST（美国国家标准与技术研究院）的同事们提出，其大小为55000训练样本和10000测试样本。图像都是28*28像素的黑白灰度图像。每张图片都代表着一个手写数字。MNIST数据集是...
【学习AI-相关路程-mnist手写数字分类-jetson-硬件：linux-自我学习AI-实验步骤-CNN-操作流程（4）】
2024-11-14 19:19

好奇龙猫的博客我们之前使用 jetson orin nx 做过了BP网络的练习，本节我们...卷积神经网络（Convolutional Neural Network，CNN）卷积神经网络（CNN）是一种深度学习模型，专为处理具有网格拓扑结构的数据而设计，如图像和语音数据。
tensorflow学习笔记——使用TensorFlow操作MNIST数据（1）
2019-07-24 11:25

叛逆的鲁鲁修love CC的博客续集请点击我：tensorflow学习笔记——使用TensorFlow操作MNIST数据（2）　本节开始学习使用tensorflow教程，当然从最简单的...　MNIST 是一个非常有名的手写体数字识别数据集，在很多资料中，这个数据集都会被...
基础科学/AI/AGI
2024-01-24 16:07

amingMM的博客机器学习——逃逸攻击机器学习之投毒攻击深度学习神经网络卷积循环对抗 CNN 模型 RNN LSTM 词向量分割卷积神经网络—*Fast SCNN* 深度学习-自动驾驶训练深度神经网络自动识别图片信息车道线检测...
基于OpenMV与STM32的数据通信项目（代码开源）
2024-01-11 20:29

混分巨兽龙某某的博客基于OpenMV与STM32的数据传输项目，手把手教学级别。包含：OpenMV发送端与STM32接收端的代码，STM32代码为HAL库版本，代码开源！
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月28日

用CNN卷积神经网络识别手写数字（MNIS 厂数据集）

2条回答 默认 最新

问题事件

2条回答默认最新