tf2.0自定义网络训练CIFAR10

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics

def preprocess(x,y):
    y = tf.squeeze(y)
    y = tf.cast(y, dtype=tf.int32)
    y = tf.one_hot(y, depth=10)
    x = tf.cast(x,dtype=tf.float32) / 255.

    return x,y

batchsize = 128
(x,y),(x_test,y_test) = datasets.cifar10.load_data()

print('datasets:',x.shape,y.shape,x.min(),x.max())

train_db = tf.data.Dataset.from_tensor_slices((x,y))
train_db = train_db.map(preprocess).shuffle(10000).batch(batchsize)
test_db = tf.data.Dataset.from_tensor_slices((x_test,y_test))
test_db = train_db.map(preprocess).batch(batchsize)


class MyDense(layers.Layer):
    # 自定义层
    def __init__(self,inp_dim,outp_dim):
        super(MyDense,self).__init__()

        self.kernel = self.add_variable('w',[inp_dim,outp_dim])
        # self.bias = self.add_variable('b',[outp_dim])

    def call(self,inputs,training=None):
        x = inputs @ self.kernel
        return x

class MyNetwork(keras.Model):
    def __init__(self):
        super(MyNetwork,self).__init__()

        self.fc1 = MyDense(32*32*3,256)
        self.fc2 = MyDense(256, 128)
        self.fc3 = MyDense(128, 64)
        self.fc4 = MyDense(64, 32)
        self.fc5 = MyDense(32, 10)

    def call(self,inputs,training=None):
        x = tf.reshape(inputs,[-1,32*32*3])
        x = self.fc1(x)
        x = tf.nn.relu(x)
        x = self.fc2(x)
        x = tf.nn.relu(x)
        x = self.fc3(x)
        x = tf.nn.relu(x)
        x = self.fc4(x)
        x = tf.nn.relu(x)
        x = self.fc5(x)
        return x

network = MyNetwork()
network.compile(
    optimizer=optimizers.Adam(lr=0.001),
    loss=tf.losses.CategoricalCrossentropy(from_logits=True),
    metrics=['accuracy']
)

network.fit(train_db,epochs=5,validation_data=test_db,validation_freq=1)


network.evaluate(test_db)

报错信息：

 File "E:/python/TF2.0/study_bili/CIFAR10.py", line 66, in <module>
    network.fit(train_db,epochs=5,validation_data=test_db,validation_freq=1)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\keras\engine\training.py", line 108, in _method_wrapper
    return method(self, *args, **kwargs)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\keras\engine\training.py", line 1133, in fit
    return_dict=True)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\keras\engine\training.py", line 108, in _method_wrapper
    return method(self, *args, **kwargs)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\keras\engine\training.py", line 1379, in evaluate
    tmp_logs = test_function(iterator)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\def_function.py", line 780, in __call__
    result = self._call(*args, **kwds)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\def_function.py", line 846, in _call
    return self._concrete_stateful_fn._filtered_call(canon_args, canon_kwds)  # pylint: disable=protected-access
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\function.py", line 1848, in _filtered_call
    cancellation_manager=cancellation_manager)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\function.py", line 1924, in _call_flat
    ctx, args, cancellation_manager=cancellation_manager))
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\function.py", line 550, in call
    ctx=ctx)
  File "D:\Anaconda3\envs\TF\lib\site-packages\tensorflow\python\eager\execute.py", line 60, in quick_execute
    inputs, attrs, num_outputs)
tensorflow.python.framework.errors_impl.InvalidArgumentError:  logits and labels must be broadcastable: logits_size=[16384,10] labels_size=[163840,10]
	 [[node categorical_crossentropy/softmax_cross_entropy_with_logits (defined at E:/python/TF2.0/study_bili/CIFAR10.py:66) ]] [Op:__inference_test_function_1742]

Function call stack:
test_function

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
半调子全栈 2023-04-22 16:48
关注
根据错误信息可以看出，logits_size=[16384,10]与labels_size=[163840,10]不一致，导致不能广播，因此出现了InvalidArgumentError错误。

具体来说，logits_size表示的是模型输出的形状，这里是[batch_size, 10]，而labels_size表示的是标签的形状，这里是[batch_size*10, 10]。这是由于在preprocess()函数中使用了tf.one_hot()函数将标签进行了独热编码，将形状从[batch_size, 1]变成了[batch_size, 10]。

为了解决这个问题，可以将train_db和test_db中的标签不进行独热编码，即将preprocess()函数中的以下代码：

y = tf.one_hot(y, depth=10)

改为：

y = tf.cast(y, dtype=tf.int32)

这样可以保证标签的形状与模型输出的形状一致，从而解决这个错误。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用tf.GradientTape() 对网络求导是否可行人工智能神经网络
2021-08-18 16:13

回答 1 已采纳已解决
改为tf2.0的新版本代码后，提示不存在 python 有问必答
2021-05-31 21:50

回答 3 已采纳 tf2运行tf1版本写的代码会有很多问题，有关解决办法，可以参考一下这篇博客https://blog.csdn.net/jinyuehai/article/details/113280968
全卷积网络结构问题[Tensorflow2.0] tensorflow 神经网络
2021-09-06 09:16

回答 1 已采纳
TF2.0深度学习实战（六）：搭建GoogLeNet卷积神经网络
2020-04-13 16:40

AI 菌的博客史上最全深度学习讲解，手把手教你搭建神经网络~
把训练好的cifar10数据集的模型并预测好的代码部署在django上，部署之后程序运行出错 django python 后端有问必答
2022-04-11 13:15

回答 1 已采纳 keras.preprocessing.image.load_image(path) 其中 path 是文件路径而不是 image 本身的内容最简单的办法：django把图片保存成文件后给 load
tensorflow训练网络报错Invalid argument tensorflow 人工智能机器学习深度学习神经网络
2019-09-06 17:29

回答 1 已采纳 print(sess.run(cost),feed_dict=feeds_train) 你把数据喂到了外边在cost后加逗号，然后接喂的数据
jupyter 中tf 搭建神经网络如何确定自己的GPU参与了计算？ python 分类神经网络
2022-03-02 23:40

回答 1 已采纳有个简单的办法，提前打开任务管理器翻到GPU那一栏，在训练或者预测数据的时候观察各项指标特别是复制有没有起伏
Tensorflow2.0笔记 - 自定义Layer和Model实现CIFAR10数据集的训练
2024-04-03 20:37

亦枫Leonlew的博客 自定义的Layer和Model实现较为简单，参数量较少，并且没有卷积层和dropout等，最终准确率不高，仅做练习使用。本笔记记录使用自定义Layer和Model来做CIFAR10数据集的训练。
自定义神经网络保存为h5文件 keras python tensorflow
2023-04-16 13:40

回答 2 已采纳努力の小熊结合了最新版本ChatGPT4.0的回答：将自定义神经网络模型保存为h5文件在这种情况下可能不是最佳选择，因为h5文件存储对于具有自定义层和训练逻辑的模型可能不适用。不过，你可以使用 Ten
win10 keras神经网络模型转c++识别 c++ python 人工智能有问必答
2021-08-10 16:26

回答 1 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
tensorflow自定义的损失函数 focal_loss出现inf，在训练过程中出现inf tensorflow 深度学习神经网络
2019-05-05 14:51

回答 1 已采纳解决方法 ``` def focal_loss_calc(alpha=0.25, gamma=2., epsilon=1e-6): """ focal loss used for tra
一文弄懂理解Batch Normalization在深度学习中的作用(含TF2.0实操代码)
2021-04-12 21:37

往事如yan的博客问题1: 随着网络训练，浅层的权重发生变化，导致深层的输入变化很大。因此每层必须根据每批输入的不同分布重新调整其权重。这减缓了模型训练。如果我们可以使层的输入分布更相似，那么网络可以专注于学习类别之间的...
深度神经网络训练过程中，损失函数的值没有变化神经网络
2017-07-04 07:37

回答 1 已采纳问题解决了，是激活函数的问题，relu激活函数的激活率太低，很多神经元死掉了
TensorFlow高阶 API: keras教程-使用tf.keras搭建mnist手写数字识别网络
2018-12-10 19:06

AI吃大瓜的博客 TensorFlow高阶 API：keras教程-使用tf.keras搭建mnist手写数字识别网络目录 TensorFlow高阶 API：keras教程-使用tf.keras搭建mnist手写数字识别网络 1、Keras 2、导入 tf.keras 3、构建简单的模型 3.1、序列...
使用TensorFlow 2.0实现Vision Transformer
2022-09-06 11:41

woshicver的博客当Transformer问世时，它最初成为NLP任务的先进模型之一。”Alex Dosovitskiy等人在2021国际表征学习会议（ICLR）上提出的“An Image is Worth 16X16 Words”，...这篇文章是使用TensorFlow 2.0对Vision Transform...
没有解决我的问题, 去提问

悬赏问题

¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用

tf2.0自定义网络训练CIFAR10

1条回答 默认 最新

悬赏问题

1条回答默认最新