使用RNN进行手写数字识别，为什么正确率总是无法提高

我使用最简单RNN进行mnist手写数字的识别，为什么交叉商总是无法降低呢。完整代码如下。

import tensorflow as tf

from tensorflow.contrib.layers import fully_connected
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('/home/as/mnist_dataset', one_hot=True)
n_steps = 28
n_inputs = 28
n_neurons = 100
x = tf.placeholder(tf.float32,[None,n_steps,n_inputs])
action_one_hot = tf.placeholder(tf.float32,[None,10])

basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)
output_seqs, states = tf.nn.dynamic_rnn(basic_cell,x,dtype=tf.float32)
y0 = fully_connected(states,100,activation_fn=tf.nn.relu)
y = fully_connected(y0,10)
cross_entropy = tf.nn.softmax_cross_entropy_with_logits(labels=action_one_hot, logits=y)
mean_loss = tf.reduce_mean(cross_entropy)
trian_op = tf.train.AdamOptimizer(0.001).minimize(mean_loss)

with tf.Session() as sess:
    for i in range(10000):
        sess.run(tf.global_variables_initializer())
        x1,y1 = mnist.train.next_batch(1000)
        x1 = x1.reshape((-1,n_steps,n_inputs))
        sess.run(trian_op,feed_dict={x:x1,action_one_hot:y1})
        if i%200==0:
            print(sess.run(mean_loss,feed_dict={x:x1,action_one_hot:y1}))

就是在每200步输出一下交叉商，但是这个交叉商总是无法下降。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-11-10 07:53
关注
RNN做文字识别没有什么优势，建议你用CNN。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么RNN无法处理长序列？ rnn 人工智能机器学习
2022-11-10 21:32

回答 1 已采纳梯度爆炸或者梯度消失，你想想每个时刻都累加一点点，序列一长到后面是很可观的。这也是为什么会有LSTM出现的原因，就是为了解决长序列的问题
encoder-decoder内，encoder层使用gru前的rnn或cnn是什么用？ python 人工智能机器学习
2021-05-24 22:51

回答 1 已采纳这个一般是根据任务特点而定的，不同的任务要根据这个任务的特点来选择网络结构。从你的问题描述，我猜测可能的情况是（以NLP任务为例）：1. 使用CNN对字向量进行卷积得到词向量，再将词向量输入到GRU中
tensorflow RNN LSTM代码运行不正确？ tensorflow 人工智能深度学习神经网络
2019-10-04 20:43

回答 2 已采纳试着把X和Y定义placeholder时的维度，由batch_size换成None. 因为你这样是固定了传入的数据集大小，在测试集时的维度是10000个，而不是batch-size个
神经网络实现手写数字识别（MNIST）
2017-05-10 18:20

玄道公子的博客神经网络实现迷宫游戏的思路，在本篇当中也写如何使用神经网络实现迷宫的，但是研究了一下，感觉有些麻烦不太好弄，所以就选择了比较常见的方式，实现手写数字识别（所谓的MNIST）。二、人工神经网络简介 ...
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
吴恩达deeplearning.ai课程中序列模型这一章的作业Rnn（lstm）反向传播推导 lstm rnn 深度学习
2018-08-23 06:40

回答 4 已采纳 https://blog.csdn.net/Koala_Tree/article/details/79299358
所谓的RNN不能并行到底指的什么？跟数据并行训练冲突吗？神经网络
2021-03-26 10:12

回答 2 已采纳类似流水线，上面的加工完才能到下面，而不能说同时加工同一个产品
深度学习实战入门——CNN实现MNIST手写数字识别
2021-03-15 15:57

人形自走写bug机的博客深度学习实战入门——CNN实现MNIST手写数字识别今天来从头自己搭一个非常简单的卷积网络，使用的数据集是MNIST. MNIST应该算是一个被用烂了的数据集了，非常非常适合初学，数据量比较小，数据处理、训练和预测的...
哪位知道怎样将RNN模型替换为GRU或者LSTM python 神经网络自然语言处理
2022-12-09 10:02

回答 1 已采纳望采纳，要把 RNN 模型替换成 GRU 或 LSTM，那么需要把原来使用的 RNN 层换成 GRU 层或 LSTM 层。这个过程有以下几个注意点：替换层时，需要确保输入和输出的形状相同。例如，如果
RNN 展开实现LSTM按时间步迭代时，有必要令reuse=true么？ tensorflow 人工智能深度学习神经网络自然语言处理
2019-04-06 15:23

回答 1 已采纳看你的数据是怎样的，如果每组数据之间在时序上独立，就不要reuse，否可可以use。简单来说，不用reuse，也就是不共享权值不会有什么大影响，但是错误用了它，会导致正确率不上升。
LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
【AI实战】训练第一个AI模型：MNIST手写数字识别模型
2019-05-18 10:35

雪饼ai的博客在上篇文章中，我们已经把AI的基础环境搭建好了（见文章：Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基础环境），接下来将基于tensorflow训练第一个AI模型：MNIST手写数字识别模型。 MNIST是一个经典的手写...
在用rnn编码解码训练模型时出现了问题：Expected hidden[0] size (1, 16, 128), got [2, 16, 128]，请问是什么意思？ rnn 神经网络自然语言处理
2021-11-18 22:10

回答 1 已采纳维度不匹配，具体情况没有更详细的代码和报错只能知道说模型的要求的大小是1，但是你变成了2
基于matlab的手写体数字识别系统
2021-08-28 21:34

sunny_chenxi的博客文章在matlab软件的基础上，利用BP神经网络算法完成手写体数字的识别。机器学习是一门多领域交叉学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织己有的知识结构，使之不断改善...
【PyTorch 深度学习实战】基于RNN & LSTM 实现 MNIST手写数字识别 (附源代码 | 详解) | 附：解决Jupyter无法启动问题No module named‘resource‘
2023-05-02 15:40

追光者♂的博客 RNN（循环神经网络）和 LSTM（长短时记忆网络）是深度学习中两种不同类型的神经网络。它们都是为了解决一些复杂的任务，如序列到序列的预测、序列到单词的翻译等。RNN主要用于处理序列数据，它有一个时间步长的概念...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

使用RNN进行手写数字识别，为什么正确率总是无法提高

1条回答 默认 最新

悬赏问题

1条回答默认最新