模型的batch_size与层的batch_size不一致，该怎么办呢？

在同一个模型中，有两个相同batch_size但不同的输入，分别进入不同的层，为什么经过多头注意力层的输出batch_size会是其输入的batch_size，而不是根据模型设置的batch_size呢？（注意力层的batch_size=None，也没有显式设置过，就算设置为固定值，其输出还是整个输入的batch_size）
我想要让经过这一层输出的batch_size和整个模型的保持一致，应该怎么办呢，求各位指点指点哇。

train_x_att_input = Input(shape=(train_x_att.shape[1], train_x_att.shape[2]))
    multi_head_attition_layer = tf.keras.layers.MultiHeadAttention(num_heads=num_heads, key_dim=key_dim,
                                                                   output_shape=num_heads * key_dim, batch_size=None)
    concat_att = multi_head_attition_layer(train_x_att, train_x_att)   # train_x_att.shape=(177,14,15)
    print(concat_att.shape)  # 输出(177,14,14) 为什么不是(None,14,14)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
桃宝护卫队 2023-04-07 15:32
关注
在tensorflow中，如果一个层没有指定输入的batch_size，则该层的输出将自动采用输入张量的batch_size，这意味着如果你的输入张量的batch_size为None，则输出也将是None。因此，在你的情况下，由于输入张量的batch_size为None，所以输出也是None。

要让经过该层输出的batch_size与整个模型的batch_size保持一致，你可以在定义输入张量时明确指定batch_size的大小，而不是使用None。例如，你可以这样定义输入张量：

train_x_att_input = Input(shape=(train_x_att.shape[1], train_x_att.shape[2]), batch_size=batch_size)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

模型的batch_size与层的batch_size不一致，该怎么办呢？ batch python tensorflow
2023-04-07 15:25

回答 1 已采纳在tensorflow中，如果一个层没有指定输入的batch_size，则该层的输出将自动采用输入张量的batch_size，这意味着如果你的输入张量的batch_size为None，则输出也将是No
ValueError: Expected input batch_size (1) to match target batch_size (0). python
2022-05-31 13:41

回答 1 已采纳可以参考解决ValueError: Expected input batch_size () to match target batch_size ().问题_小破船Z
batch_id是什么意思？ python
2022-07-25 16:55

回答 2 已采纳循环变量。是同时变化的enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标https://www.runoob.com/python
深度学习笔记（二）训练批次 batch_size的设置问题
2022-06-12 16:18

汤姆和佩琦的博客摘要：有关深度学习过程中超参数batch_size的调整的一些经验总结
模型训练batchsize大小设置的理解 lstm 深度学习神经网络
2022-01-20 11:34

回答 1 已采纳按照你的想法应该是1，但如果你了解下batchsize是干什么用的，你就会知道设置成1并没有什么好处，返回容易导致过拟合现象
在mysql jdbc 驱动中如何设置 batch_size
2009-07-22 14:36

回答 2 已采纳 Mysql,Oracle等等的JDBC驱动好像都没有提供类似Batch的相关操作. Hibernate的Batch是Hibernate自己的维护的吧,目的是减少对数据连接的频繁取用和释放.和底层数据库
batch_normalization和layer_normalization的区别？ opencv
2022-12-09 09:40

回答 1 已采纳前者再normalize的时候是在batch的方向，后者在normalize的时候是句子的方向。
batch_size对精确度和损失的影响
2023-06-13 00:00

算法与编程之美的博客 1 问题在深度学习的学习过程中，模型性能对batchsize虽然没有学习率那么敏感，但是在进一步提升模型性能时，batch_size就会成为一个非常关键的参数。batch_size对精度和损失的影响研究。batch_size = [,32,64,128，...
关于keras 对模型进行训练 train_on_batch参数和模型输出的关系人工智能机器学习深度学习神经网络
2020-03-27 16:24

回答 1 已采纳 https://blog.csdn.net/weixin_42886817/article/details/99855287
我们代码里的learning rate是一个batch总的学习率还是一个data的学习率？ tensorflow 人工智能深度学习
2021-04-28 16:06

回答 1 已采纳 batch总的学习率
如何在Change Stream Watch API（Mongo-Go-Driver）中设置batchSize？ mongodb
2018-10-06 19:22

回答 1 已采纳 This looks like a bug in the current mongo-go-driver (v0.0.16) where the batchSize option is passe
模型微调：如何处理数据集的不平衡和不一致性
2023-07-17 01:10

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术在深度学习任务中，训练样本往往存在严重的不平衡或不一致的问题，比如对于不同类别的数据数量分布不同，这就使得模型在训练时容易欠拟合或过拟合，从而导致准确率低下。因此，对于预测...
训练与测试模型时所用图片的分辨率不同，运行时出错该怎么解决？ python 深度学习
2022-12-25 17:36

回答 1 已采纳如果训练的图片分辨率是 28×28，那么把学习图片 resize 到28×28，不会因为分辨率太小而影响判断。影响判断的原因，是最好不要直接将全部像素作为输入向量，而是提取特征向量，例如 HOG 向
如何训练一个 BERT 深度学习语言模型?
2023-09-11 01:14

禅与计算机程序设计艺术的博客本文作者是资深人工智能...此外，基于深度学习的语言模型也可以在多语言之间迁移，并帮助构建跨语言的任务，比如：自动摘要、文章审核、语言检测等。使用BERT训练BERT预训练模型；微调BERT预训练模型进行下游任务微调；
pytorch设置batch
2022-07-02 07:50

<编程路上>的博客使用pytorch进行数据网络训练时，数据集可能有上万条数据，训练的话比较浪费时间，设置batch，一次训练一个batch_size的大小，既节省时间，又可以使数据集快速收敛。使用前需要导入包：设置batch，需要将训练数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月7日

悬赏问题

¥15 关于#java#的问题：找一份能快速看完mooc视频的代码
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码
¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
¥15 网络设备配置与管理这个该怎么弄
¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！

模型的batch_size与层的batch_size不一致，该怎么办呢？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新