tensorflow自定义层报错：无法在第一维度未知的张量上迭代

我在用Tensorflow的自定义层构建模型时报错：

  File "seq2seq.py", line 414, in <module>
    _, state_h, state_c = encoder_lstm(encoder_embedding)
  File "C:\Users\sjq\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\LocalCache\local-packages\Python38\site-packages\keras\engine\keras_tensor.py", line 415, in __iter__
    raise TypeError(
TypeError: Cannot iterate over a Tensor with unknown first dimension.

这是我的层定义和模型定义代码：

    class EnhancedAttentionGRUCell_41(AttentionGRUCell):
        def __init__(self, units, att_units, temp=1.0, **kwargs):
            super().__init__(units, att_units, **kwargs)
            self.en = En(att_units)
            self.aaaaa = Aa(temp)
            
        def call(self, inputs, states, training=None):
            tf.compat.v1.enable_eager_execution()
            print('ss',inputs.shape)
            h_prev, seq_embed = states
            
            h_gru, _ = self.gru_cell(inputs, states=[h_prev])
            attended_seq = self.en(seq_embed)
            temp_pooled_attended_seq = self.aaaaa(attended_seq)
            output = tf.concat([h_gru, temp_pooled_attended_seq], axis=-1)
            
            return output, [output, seq_embed]
    class AttentionGRULayerEn_41(Layer):
        def __init__(self, units, att_units, **kwargs):
            super(AttentionGRULayerEn_41, self).__init__(**kwargs)
            self.cell = EnhancedAttentionGRUCell_41(units, att_units)
            self.units = units
            self.att_units = att_units
            self.input_dim=2048*20
            
        '''
        def get_initial_state(self, inputs):
            batch_size = tf.shape(inputs)[0]
            initial_hidden = tf.zeros(shape=(batch_size, self.units))
            return initial_hidden, inputs
        '''
        def get_initial_state(self, inputs):
            batch_size = batchsize#tf.shape(inputs)[0]  # 获取动态批次大小
            initial_hidden = tf.zeros(shape=(batch_size, self.units))  # 根据批次大小创建隐藏状态
            initial_seq_embed = tf.zeros(shape=(batch_size, tf.shape(inputs)[1], self.input_dim)) 
            return initial_hidden, initial_seq_embed
        

        def call(self, inputs, states=None, training=None):
            if not tf.executing_eagerly():
                return inputs
            if states is None:
                states = self.get_initial_state(inputs)
            #tf.assert_rank(x, 2)
            #print(inputs.shape)
            outputs, new_states = tf.keras.backend.rnn(self.cell, inputs, states,
                                                      constants=None, unroll=False, time_major=False,
                                                      go_backwards=False, mask=None)
            final_output = outputs if isinstance(outputs, tf.Tensor) else outputs[-1]
            return final_output, new_states




        encoder_inputs = Input(shape=(None,))
        encoder_embedding = Embedding(input_dim=input_vocab_size,
            output_dim=embedding_dim)(encoder_inputs)
        encoder_lstm = LSTM(units)
        _, state_h, state_c = encoder_lstm(encoder_embedding)
        encoder_states = [state_h, state_c]

        model_encoder = Model(encoder_inputs, encoder_states)

        # 解码器模型
        decoder_inputs = Input(shape=(None, ))
        decoder_embedding = Embedding(input_dim=output_vocab_size, output_dim=embedding_dim,
                                      batch_input_shape=[batchsize, None])(decoder_inputs)
        decoder_lstm = AttentionGRULayerEn_41(units, units)
        decoder_outputs, _, _ = decoder_lstm(decoder_embedding, initial_state=encoder_states)
        decoder_dense = Dense(output_vocab_size, activation='softmax')
        decoder_outputs = decoder_dense(decoder_outputs)

        model_decoder = Model([decoder_inputs] + encoder_states, [decoder_outputs])

        # 训练模型
        model = Model([encoder_inputs, decoder_inputs], decoder_outputs)
        model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-07-21 21:20
关注
以下内容由AIGC及阿里嘎多学长共同生成、有用望采纳：

根据您提供的错误信息和代码，以下是可能的解决方案和一些建议：

TypeError错误：这个错误通常发生在尝试迭代或操作一个形状不确定的Tensor时。在您的代码中，TypeError: Cannot iterate over a Tensor with unknown first dimension. 错误可能是由于encoder_embedding的输出形状不确定导致的。您需要确保encoder_embedding的输出形状是已知的，或者在使用它之前将其转换为具有确定形状的Tensor。

自定义层的兼容性问题：看起来您的自定义层AttentionGRULayerEn_41在某些方面与Tensorflow的预期行为不兼容。这可能是因为自定义层的实现与Tensorflow的内部机制不匹配。您需要检查自定义层的实现，确保它遵循Tensorflow的API规范。

确保张量维度一致性：在自定义层中使用tf.concat时，需要确保所有参与合并的Tensor在除了合并轴之外的其他维度上形状是一致的。检查h_gru和temp_pooled_attended_seq的维度，确保它们在合并前是兼容的。

检查自定义层的初始化和调用逻辑：在EnhancedAttentionGRUCell_41的call方法中，您启用了Eager Execution，这在自定义层中通常不是必需的。此外，您在get_initial_state中使用了batchsize变量，但没有在函数签名中定义它。确保所有变量在使用前都已经被正确定义和初始化。

动态批处理大小的处理：在get_initial_state方法中，您使用了batch_size来创建初始状态，但是注释中提到使用tf.shape(inputs)[0]来获取动态批次大小。确保您使用的是正确的方法来获取批次大小，并且它与模型的其他部分兼容。

Eager Execution的启用：在自定义层中启用Eager Execution可能会影响Tensorflow的图执行模式，这可能会导致一些不可预见的问题。除非您有特别的理由需要这样做，否则建议不要在自定义层中启用Eager Execution。

模型构建和编译：确保在构建模型时，所有层都按照预期连接，并且在编译模型时指定了正确的优化器、损失函数和评估指标。检查model、model_encoder和model_decoder的构建逻辑，确保它们正确地组合了输入、输出和状态。

针对您的代码，这里有一些具体的建议：

移除tf.compat.v1.enable_eager_execution()，因为它可能不是必要的，并且可能会干扰Tensorflow的图执行模式。
确保batchsize在使用之前已经被定义，并且是正确的值。
检查encoder_embedding的输出形状，确保它在传递给encoder_lstm之前是已知的。
在自定义层中，确保所有张量操作都有正确的维度，特别是在使用tf.concat时。
仔细检查自定义层的实现，特别是状态管理和张量操作，确保它们与Tensorflow的预期行为一致。

最后，如果您在解决这些问题时仍然遇到困难，您可能需要查阅Tensorflow的官方文档或社区论坛，以获取更多关于自定义层实现的帮助和建议。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

报错：Process finished with exit code -1073741819 (0xC0000005) python 人工智能有问必答
2021-10-15 09:18

回答 2 已采纳没有csv文件，我也运行不起来。。。
tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
Tensorflow中张量问题 python tensorflow
2022-03-19 20:18

回答 1 已采纳 tf.convert_to_tensor(np.array(range(11, 31)).reshape(B, W, D))B, W, D你自己定
北京大学 人工智能实践：Tensorflow笔记——曹健（writed by Enigmalgia）
2018-12-19 11:17

Enigmalgia的博客可以看下我转载的一篇文章机器学习入门概括关于TensorFlow的安装Ubuntu18.04下安装anaconda和pycharm搭建TensorFlow 贴一下TensorFlow的官方中文版教程 TensorFlow的中文API文档曹健老师的GitHub源码持续...
tensorflow张量dtype=float_ref keras python tensorflow
2022-02-28 21:08

回答 1 已采纳 https://github.com/tensorflow/tens
使用tensorflow时在 '__init__.py' 中找不到引用 python tensorflow 机器学习
2021-05-03 17:32

回答 1 已采纳我把你的代码拿到本地跑了，首先你的代码的API是TF1.x版本的，我本地用的是tf1.15，所以第一步是把TF切换到1.15(我测试通过了，看你用Anaconda，那么安装就很简单了conda ins
LSTM神经网络模型张量与变量维度不匹配 lstm python tensorflow
2023-04-03 17:51

回答 3 已采纳与之前模型的checkpoint路径重合，新建一个路径保存即可
听说用 C# 写 TensorFlow 更高效？
2020-09-22 07:40

dotNET跨平台的博客经过半年呕心沥血的努力，SciSharp STACK终于把Tensorflow .NET绑定升级到可以使用 tensorflow 2.3, 新版本最大的优势是实现了Eager模式, 这个...
【提问-pytorch运行报错】CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)` pytorch
2021-08-20 11:18

回答 1 已采纳 label是类别，比如说（“100，“110”,“111“），你的100是第0类，110是第1类，111是第2类，你这么写变成了100是第100类，110是第110类，111是第111类了，原本你只有
如何用tensorrt实现两个维度大小不同的张量点乘mul c++ python 深度学习
2023-04-17 21:42

回答 2 已采纳在TensorRT中，可以使用plugin来自定义计算算法，实现两个维度大小不同的张量的点乘操作。具体流程如下：实现一个自定义的TensorRT插件，可以继承IPluginV2接口。在实现该插件时，
关于#TensorFlow-GPU#的问题，运行结果中的提示信息如何解读？ python tensorflow 机器学习
2022-02-25 14:58

回答 1 已采纳一般只要不是E或者error报错，可以都不管，是tf输出的一些日志信息
《《《书》》》TensorFlow：实战Google深度学习框架笔记_1-6章
2019-01-09 13:50

weixin_36662031的博客《TensorFlow：实战Google深度学习框架（第二版）》笔记【1-6章】第一章：深度学习简介 1.人工和深度学习的不同既然人工的方式无法很好地抽取实体中的特征，那么是否有自动的方式呢？深度学习解决的核心问题之一...
关于张量存储到list中报错：AttributeError: 'Tensor' object has no attribute 'append' python pytorch 有问必答
2021-11-23 11:20

回答 3 已采纳 data = torch.cat(data, 0) 这一行后data是个tensor对象了，后面再for循环时候不是list 也就不能append，可以等for结束后再执行这个拼接
深度学习实现案例(Tensorflow、PaddlePaddle)
2020-07-22 11:17

YEGE学AI算法的博客文章目录深度学习实验案例一、基础理论实验一：自定义感知机实验二：验证图像卷积运算效果二、Tensorflow实验一：查看Tensorflow版本实验二：Helloworld程序实验三：张量相加实验四：查看图对象实验五：指定执行某个...
Tensorflow Google深度学习框架
2019-03-14 12:40

钢铁-程序猿的博客！！代码：https://github.com/caicloud/tensorflow-tutorial 第一章：深度学习简介在大部分情况下，在训练数据达到一定数量之前，越多的训练数据可以使逻辑回归算法对未知邮件做出的判断越精准。之所以...
Datawhale AI夏令营NLP自然语言处理-Task2学习笔记
2024-07-17 11:38

Pluses的博客 Datawhale AI夏令营NLP自然语言处理-Task2学习笔记
深度学习之：数据增强总结与实战
2020-07-06 21:23

Tim_Tang_CS的博客当下以数据驱动的AI，在实际场景中，我们很难有大量带标签的训练样本，当我们使用深度学习神经网络训练一个模型时，数以百万计的模型参数需要训练，数据量太小的话，很容易产生过拟合，训练出的模型也很难具备良好的...
PyTorch深度学习小技巧70个
2024-07-27 02:22

游心ME的博客预览版本PyTorch基础1）导入PyTorch：import torch2）安装PyTorch（终端命令行在对应python环境中下载）：pip install torch3）创建张量：torch.tensor()4）将NumPy数组转换为PyTorch张量：torch.from_numpy()5）...
《程序员创业指南：一人公司实现财富自由之路》从字节跳动架构师到“一人公司”创始人：AI大模型个人生产力工具创业实战指南3
2024-09-21 01:27

光剑书架上的书的博客随着人工智能技术的飞速发展，尤其是 AI 大模型的出现，个人开发者也有了更多的机会去创造有价值的产品。本文将以一位前字节跳动架构师的亲身经历为例，分享他是如何利用 AI 大模型打造个人生产力工具，最终实现 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月21日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

tensorflow自定义层报错：无法在第一维度未知的张量上迭代

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新