手写体识别时，pred_y 返回全都是0

mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 定义onehot函数：
def onehot(y, start, end, categories='auto'):
    oht = OneHotEncoder()
    a = np.linspace(start, end - 1, end - start)
    b = np.reshape(a, [-1, 1]).astype(np.int32)
    oht.fit(b)
    c = oht.transform(y).toarray()
    return c

y_train = np.reshape(y_train, [-1, 1]).astype(np.int32)
y_train = onehot(y_train, 0, 10)
y_test = np.reshape(y_test, [-1, 1]).astype(np.int32)
y_test = onehot(y_test, 0, 10)
X_train = np.reshape(X_train, [-1, 784]).astype(np.float32)
X_test = np.reshape(X_test, [-1, 784]).astype(np.float32)

x = tf.placeholder(tf.float32, [None, 784])  # 图像数据，N行784列
y = tf.placeholder(tf.float32, [None, 10])  # 输出数据（标签，即图像真实类别），N行10列
w = tf.Variable(tf.random_normal([784, 10]))  # 权重
b = tf.Variable(tf.zeros([10]))  # 偏置，一行十列

pred_y = tf.nn.softmax(tf.matmul(x, w) + b)
print(pred_y.shape)
# 损失函数（交叉熵）
cross_entropy = -tf.reduce_sum(y * tf.log(pred_y), reduction_indices=1)
cost = tf.reduce_mean(cross_entropy)
# 梯度下降优化器
optimizer = tf.train.GradientDescentOptimizer(0.001).minimize(cost)

# 批次大小
batch_size = 100
saver = tf.train.Saver()
model_path = './model/'  # 模型路径

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    # 开始训练
    for epoch in range(10):
        total_batch = int(X_train.shape[0] / batch_size)  # 总批次
        avg_cost = 0.0

        for i in range(total_batch):
            batch_x = X_train[i * batch_size:(i + 1) * batch_size, :]
            # batch_x = np.reshape(batch_x, [-1, 784])
            batch_y = y_train[i * batch_size:(i + 1) * batch_size, :]
            op, c = sess.run([optimizer, cost],
                             feed_dict={x: batch_x, y: batch_y})

            avg_cost += (c / total_batch)
        print("epoch:%d, cost=%.9f" % (epoch + 1, avg_cost))
    print('训练结束')

    # 模型评估
    # 比较预测结果和真实值，返回布尔类型的数组
    correct_pred = tf.equal(tf.argmax(y, 1), tf.argmax(pred_y, 1))
    # 将布尔类型数组转换为浮点数，并计算准确率
    accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

    print('准确率：', accuracy.eval({x: X_test, y: y_test}))
    print(sess.run(tf.argmax(y_test[:30], 1)), "Real Number")
    print(sess.run(tf.argmax(pred_y[:30], 1), feed_dict={x: X_test, y: y_test}), "Prediction Number")
    # 保存模型
    save_path = saver.save(sess, model_path)
    print('模型已保存')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
你知我知皆知 2024-07-24 19:28
关注
以下回答参考 皆我百晓生、券券喵儿 等免费微信小程序相关内容作答，并由本人整理回复。

在给定的代码中，pred_y 的输出是一个全都是 0 的向量。这可能是因为 softmax() 函数没有正确地应用到输入数据上。softmax() 函数是用于将多分类问题中的概率分布转换成概率比例的函数。

要解决此问题，您需要确保在使用 softmax() 函数之前对数据进行适当的预处理。例如，您可以先对输入数据进行归一化或标准化操作，以消除不同值之间的差异。以下是一个简单的示例：

from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.transform(X_test)

这样做的目的是使所有特征在相同的尺度下进行比较，从而使得模型更容易学习。接下来，您可以继续执行其他步骤来完成您的手写体识别任务。

注意：以上代码片段仅作为示例，实际的实现可能会根据具体需求有所不同。如果您有特定的需求，请提供更多的详细信息以便我能为您提供更具体的帮助。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python做逻辑回归模型，y_test和y_pred_test是什么含义 python 逻辑回归
2022-01-30 22:13

回答 2 已采纳做逻辑回归，最好把样本集合(xSample, ySample) 分为训练样本集(xTrain, yTrain) 与检验样本集(xTest,yTest)，以免出现过拟合。由于模型是由 xTrain
Python 语句pred = d1[:,0,:,:]是什么意思 python
2021-04-03 16:39

回答 1 已采纳 pred赋值为数组d1每一列的第一个，是一种简单的写法可以参考此文章https://blog.csdn.net/gqixf/article/details/80521272
人工智能猫狗识别程序，模板已训练完成，进行识别的时候无法找到目标文件夹，但是文件夹地址是对的 keras python 人工智能
2022-11-03 19:01

回答 1 已采纳这里少了一个斜杠
人工智能中相关的术语概念知识
2021-08-23 10:08

あずにゃん的博客现在有很多在Imagenet等数据集上训练的很好的模型，当我们使用相同的网络结构时可以直接拿来调用，而不必花很多时间你去从头造轮子。 2.下面对预训练模型的使用场景做一个简单的理解： 1.当数据集小的时候： 1...
用fastshap计算的shap值全都是0 r语言机器学习随机森林
2023-03-11 11:57

回答 1 已采纳如果得到的 shap 表中所有的值都是0，通常可能存在以下几个问题：训练数据中所有的特征值对目标变量的影响相同，导致 shap 值都为0。模型的预测效果较差，导致 shap 值不能有效反映特征值对目
手写字母识别项目求解答图像处理
2022-09-09 08:50

回答 1 已采纳你的卷积池化堆叠太少了，导致全连接层参数巨多，而样本数不足所以loss很那下降。先尝试把模型的卷积池化多堆叠一些，然后重新训练试试看
C++ vector中，vector <int> pred， &pred是什么意思？ c++
2021-06-20 18:42

回答 1 已采纳 vector容器的地址，很少这么用
机器学习入门基础（万字总结）（建议收藏！！！）
2022-12-04 22:36

subsistent的博客机器学习是人工智能的重要技术基础，涉及的内容十分广泛。本文章涵盖了机器学习的基础知识，主要包括机器学习的概述、回归、分类、聚类、神经网络、文本分析、图像分析、深度学习等经典的机器学习基础知识，还包括...
tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
为什么我定义了X_train程序运行时却显示X_train没有被声明 python sklearn 机器学习
2022-10-13 17:07

回答 1 已采纳
这个是为什么呀，为什么这个图像识别就是跑不起来呢 pytorch
2022-07-19 16:31

回答 1 已采纳维度不匹配，你这里224x224x3下来的，经过一次卷积一次池化，再次卷积，简单计算可能最后从224X224变道7X7X128，按照每次卷积大小不变，池化缩小2计算，你这里至少是5层的卷积池化才能达到
关于胶囊之间的动态路由的理解（基于Hinton的胶囊网络）
2018-02-28 21:02

Grant_Ward的博客例如，在手写字体中检测多个重叠的数字：胶囊协议路由(routing-by-agreement)的意义在一个全连接的神经网络中，我们通过下式计算神经元 W W W 则通过全局成本函数使用反向传播算法来训练...
python机器学习中多个数字识别该怎么办啊 python
2022-05-14 21:04

回答 1 已采纳这个建议搭建神经网络来解决，目前TensorFlow，pytorch，paddle等框架入门项目便是手写字体的识别，你可以在他们的官方文档看到完整的代码
深度学习硬啃计划与笔记
2022-06-22 00:40

「已注销」的博客这一方法被称为符号主义人工智能（symbolic AI），从 20 世纪 50 年代到 80 年代末是人工智能的主流范式。在 20 世纪 80 年代的专家系统（expert system）热潮中，这一方法的热度达到了顶峰。虽然符号主义人工智能...
Recurrent Neural Networks(RNN) 循环神经网络初探
2017-04-27 19:58

Hellowongwong的博客在检测完每个图像后，模型会输出一个标签，这个标签对应该图像的识别结果（即RNN每个时间步输出的 y 值）。同时模型对世界的认识也会有所更新（更新隐状态）。例如，模型可能会学习自主地去发现并跟踪相关的信息，如...
头歌人工智能学习记录
2023-06-08 19:19

林一百二十八的博客它被用于计算机视觉、自然语言、推荐系统等多个人工智能领域。各相关学科对神经网络的定义多种多样，我们这里采用最广泛的一种，即“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟...
人月神话
2012-08-06 00:06

疯的世界的博客 ANNIVERSAR Y EDITION）...................... I 第一版序言（PREFACE TO THE FIRST EDITION ）............................................................III 目录（CONTENTS）..........................
没有解决我的问题, 去提问

悬赏问题

¥15 网络科学导论，网络控制
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）

手写体识别时，pred_y 返回全都是0

1条回答 默认 最新

悬赏问题

1条回答默认最新