tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？

我在自己学习写人工神经网络的结构，代码放在最后面。

但是运行出来的结果报错，显示：

ValueError: cannot reshape array of size 784 into shape (32,1,newaxis)

另外就是，我试着在感觉有问题的地方，控制台输出检查了一下，发现测试部分的循环到了最后一次，会把batch数量减半，我找不到原因。x_train和 x_test使用的卷积处理函数都是相同的，输入的数据格式也是相同的。

x测试 (32, 28, 28)
x测试 (32, 28, 28)
x测试 (32, 28, 28)
x测试 (16, 28, 28)

最后还有两个小问题，一个是目前前面训练的过程，我感觉误差极大，可能是目前模型太简单只有一层的缘故，我想问一下有什么方法可以提高训练的效率吗，是不是增多神经元层数就会好些？
另一个问题是，我为了符合tf.nn.conv2d()函数的输入格式，采用了tf.squeeze()来处理张量维度的方法是否正确，会不会对输入的数据造成影响？

def output(input, get1, get2, batch):
    x = tf.expand_dims(input, 3)
    output = tf.nn.conv2d(x, get1, strides=[1, 2, 2, 1], padding='SAME')
    output = tf.nn.conv2d(output, get2, strides=[1, 2, 2, 1], padding='SAME')
    output = tf.squeeze(output, 3)
    output = np.reshape(output, (batch, 1, -1))  # 处理和输出的数据，（组数，1，-1）表示一行与n列
    output = tf.cast(output, tf.float64)
    # print(output)
    return output

程序的代码

import os
from sklearn import datasets
from matplotlib import pyplot as plt

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
import tensorflow as tf
from keras import models
import numpy as np

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

x_train = tf.cast(x_train, tf.float64)
y_train = tf.cast(y_train, tf.int32)

x_test = tf.cast(x_test, tf.float64)
y_test = tf.cast(y_test, tf.int32)

train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(32)
test_db = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(32)

# 特征类型
get_1 = tf.constant(value=np.ones((3, 3), dtype=np.float64), shape=(3, 3, 1, 1))
get_2 = tf.constant(value=np.eye(3, dtype=np.float64), shape=(3, 3, 1, 1))
# 迭代次数
epoch = 50
# 学习率
lr = 0.1
# 每轮分成4个step，loss_all由于存放每轮4个loss的和
loss_all = 0
# 记录每一轮的损失函数于列表
train_loss_results = []
# 记录测试时候的准确率于列表
test_acc = []
# 第一层权重、偏置，并且设置可以更新
w1 = tf.Variable(tf.random.truncated_normal([49, 10], stddev=0.1, seed=1, dtype=np.float64))
b1 = tf.Variable(tf.random.truncated_normal([10], stddev=0.1, seed=1, dtype=np.float64))


# 特征输出函数
def output(input, get1, get2, batch):
    x = tf.expand_dims(input, 3)
    output = tf.nn.conv2d(x, get1, strides=[1, 2, 2, 1], padding='SAME')
    output = tf.nn.conv2d(output, get2, strides=[1, 2, 2, 1], padding='SAME')
    output = tf.squeeze(output, 3)
    output = np.reshape(output, (batch, 1, -1))  # 处理和输出的数据，（组数，1，-1）表示一行与n列
    output = tf.cast(output, tf.float64)
    # print(output)
    return output


print(x_train.shape)
print(x_test.shape)
# 训练阶段
print('训练开始')
for epoch in range(epoch):
    for step1, (x_train, y_train) in enumerate(train_db):
        print('x训练', x_train.shape)
        # print(step, x_train.shape, y_train.shape)
        # print('.......分割线........')
        # print(output(x_train, get_1, get_2, 32).shape)
        # print('.......分割线........')
        # print((tf.matmul(output(x_train, get_1, get_2, 32), w1) + b1).shape)
        with tf.GradientTape() as tape:
            x = output(x_train, get_1, get_2, 32)
            y = tf.matmul(x, w1) + b1
            y = tf.nn.softmax(y)
            y_ = tf.one_hot(y_train, depth=10)
            y_ = tf.cast(y_, tf.float64)
            # 计算神经网络误差
            loss = tf.reduce_mean(tf.square(y_ - y))
            loss_all += loss.numpy()
        grads = tape.gradient(loss, [w1, b1])  # 求loss关于【w1，b1】的导数，也就是梯度
        # 实现w1、b1的自更新，更新公式为w1 = w1 - lr * w1_gard
        w1.assign_sub(lr * grads[0])
        b1.assign_sub(lr * grads[1])
    print("Epoch {},lodd: {}".format(epoch, loss_all / 4))  # 打印每个epoch的平均误差
    train_loss_results.append(loss_all / 4)  # 添加入list中，方便绘制曲线
    loss_all = 0
    total_correct, total_number = 0, 0
    for x_test, y_test in test_db:  # 测试
        print('x测试',x_test.shape)
        x = output(x_test, get_1, get_2, 32)
        y = tf.matmul(x, w1) + b1
        y = tf.nn.softmax(y)  # 转化为预测概率矩阵
        # print(y.shape)
        y = tf.squeeze(y, 1)
        # print(y.shape)
        pred = tf.argmax(y, axis=1)
        # print(pred.shape)
        pred = tf.cast(pred, dtype=y_test.dtype)
        correct = tf.cast(tf.equal(pred, y_test), dtype=tf.int32)
        correct = tf.reduce_sum(correct)
        total_correct += int(correct)
        total_number += x_test.shape[0]
    acc = total_correct / total_number
    test_acc.append(acc)
    print("Test_acc", acc)
    print("............................")

# 绘制损失曲线
plt.title('Loss Curve')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.plot(train_loss_results, label='$Loss$')
plt.legend()
plt.show()
# 绘制准确率曲线
plt.title('Acc Curve')
plt.xlabel('Epoch')
plt.ylabel('Acc')
plt.plot(train_loss_results, label='$Accuracy$')
plt.legend()
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
奋斗的番茄 2022-05-19 19:30
关注
batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
tensorflow中model.fit（）函数输入参数报错，如何解决？ python tensorflow 有问必答机器学习
2022-04-12 01:32

回答 2 已采纳 loss不是binary_crossentropy？
如下该怎么解决tensorflow报错问题呢 keras python tensorflow
2023-04-18 11:09

回答 6 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：这个报错信息意味着在加载 SavedModel 时，无法找到与输入张量匹配的适当函数。每个已保存的函数都只接受特定的输入函数签名，并且当 Saved
用PyTorch实现MNIST手写数字识别(非常详细)
2020-04-30 22:25

小锋学长生活大爆炸的博客 hello大家好！我又来搬文章了！我就不信还有比这更详细的？...在本文中，我们将在PyTorch中构建一个简单的卷积神经网络，并使用MNIST数据集训练它识别手写数字。在MNIST数据集上训练分类器可以看作是......
tensorflow断点续训报错 keras python tensorflow
2022-06-16 15:29

回答 3 已采纳执行model.load_weights(filepath)后，filepath这个文件会被占用，无法删除或重命名，导致后面的回调函数ModelCheckpoint(filepath)无法自动保存权重
vbs脚本怎么在搜索框内生成一个随机数字进行搜索？ batch 其他自动化
2022-09-07 11:34

回答 1 已采纳 Function GetRandomMath(m,n) Randomize GetRandomMath = Int(((n-m+1) * Rnd) + m) End Function Se
用TensorFlow 训练mask rcnn时，总是在执行训练语句时报错，进行不下去了，求大神 tensorflow 深度学习
2019-04-03 17:15

回答 2 已采纳 TypeError: resize_images() got an unexpected keyword argument 'preserve_aspect_ratio' 最后一行，很明显参数异
【深度学习 & 测试】基于 Keras 的手写数字识别训练 | 人工智能 面试题：请解释一下批归一化（Batch Normalization）的原理和作用
2022-11-04 16:42

追光者♂的博客【深度学习】基于 Keras 的手写数字识别训练（卷积神经网络）| 人工智能 面试题：请解释一下批归一化（Batch Normalization）的原理和作用。
关于#tensorflow#的问题，如何解决？ keras python tensorflow
2023-04-13 17:09

回答 6 已采纳这个错误提示是说在计算过程中，尝试在GPU上分配一个shape为[64,1024]的float型tensor时内存不足，导致程序崩溃。同样的原因也导致了另一个位置出现了类似的错误提示。解决这个问题的
tensorflow怎么解决这个问题，是什么问题，解决方法？ python tensorflow 神经网络
2022-04-12 09:36

回答 1 已采纳代码用控件提交，你这代码乱的.这个报错你要检查下是不是你优化器中loss的问题，你的数据标签是什么样子的，直接类别id的话不能用CategoricalCrossentropy()换成SparseCat
我们代码里的learning rate是一个batch总的学习率还是一个data的学习率？ tensorflow 人工智能深度学习
2021-04-28 16:06

回答 1 已采纳 batch总的学习率
matlab编写识别手写数字_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例...
2020-11-17 18:46

weixin_39851279的博客循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例从本专栏开始，正式开始研究Python深度学习、神经网络及人工智能相关知识。前一篇讲解了TensorFlow如何保存变量和神经网络参数，通过Saver保存神经网络，...
tensorflow 训练数据集时，报错InvalidArgumentError: Incompatible shapes: [15] vs. [15,6]，标签的占位符与标签喂的数据格式不符，要怎么解决？ tensorflow 深度学习神经网络
2020-02-19 22:42

回答 1 已采纳 pywrap_tensorflow.TF_GetCode(status)) 这里输出下 status 的 shape，是不是维度有问题
卷积神经网络与循环神经网络实战 --- 手写数字识别及诗词创作
2023-02-07 23:52

Python-AI Xenon的博客人工神经网络（Artificial Neural Networks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（Connection Model），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠...
OpenCV+TensorFlow图片手写数字识别(附源码)
2019-11-10 21:17

Color Space的博客初次接触TensorFlow，而手写数字训练识别是其最基本的入门教程，网上关于训练的教程很多，但是模型的测试大多都是官方提供的一些素材，能不能自己随便写一串数字让机器识别出来呢？纸上得来终觉浅，带着这个疑问昨晚...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金20元 5月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月19日

悬赏问题

¥15 smptlib使用465端口发送邮件失败
¥200 总是报错，能帮助用python实现程序实现高斯正反算吗？有偿
¥15 对于squad数据集的基于bert模型的微调
¥15 为什么我运行这个网络会出现以下报错？CRNN神经网络
¥20 steam下载游戏占用内存
¥15 CST保存项目时失败
¥15 树莓派5怎么用camera module 3啊
¥20 java在应用程序里获取不到扬声器设备
¥15 echarts动画效果的问题，请帮我添加一个动画。不要机器人回答。
¥15 Attention is all you need 的代码运行

tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新