paddle 卷积神经网络训练时报错InvalidArgumentError: The input tensor X of SumOp must have same shape..

毕设导师要求用paddle进行文本分类，先输入文本经过几层神经网络后，加上之前额外提取的文本特征以及经过神经网络输出的文本作为下一个全连接层的输入，初学paddle，还有很多不懂的地方，在训练的时候碰到的报错

知道是维度的问题，但是不知道怎么查看具体的数据维度
这是输入的数据（分别是文本、标签、12个特征）：

以下是构建的神经网络：

def lstm_net(ipt, x,input_dim):

    # 以数据的IDs作为输入
    print("-----------------我在lstm_net---------------------------")
    print("input_dim",input_dim)

    emb = fluid.layers.embedding(input=ipt, size=[input_dim, 128], is_sparse=True)
    print("emb",emb)
    

    # 第一个全连接层
    fc1 = fluid.layers.fc(input=emb, size=128)
    print("fc1",fc1)
    

    # 进行一个长短期记忆操作
    lstm1, _ = fluid.layers.dynamic_lstm(input=fc1, #返回：隐藏状态（hidden state），LSTM的神经元状态

                                         size=128) #size=4*hidden_size

    # 第一个最大序列池操作
    fc2 = fluid.layers.sequence_pool(input=fc1, pool_type='max')
    print("我这里是在定义长短期记忆网络lstm_net里，我在输出fc2",fc2)

    # 第二个最大序列池操作
    lstm2 = fluid.layers.sequence_pool(input=lstm1, pool_type='max')
    print("我这里是在定义长短期记忆网络lstm_net里，我在输出lstm2",lstm2)

    # 以softmax作为全连接的输出层，大小为2,也就是正负面
#     out = fluid.layers.fc(input=[fc2, lstm2], size=2, act='softmax') #size为2，输出2分类   这一层输出层删除


    #全连接层1
    fc3 = fluid.layers.fc(input=x , size=12,act=None)     #x 就是额外的特征 
    print("我这里是在定义长短期记忆网络lstm_net里，我在输出fc3",fc3)
    
    全连接层2
    fc4 = fluid.layers.fc(input =[fc3,fc2], size=128 ,act=None)
    print("我这里是在定义长短期记忆网络lstm_net里，我在输出fc4",fc4)
    
    最后输出二分类 softmax
    out = fluid.layers.fc(input=[fc2,lstm2], size=2, act='softmax') #size为2，输出2分类   
    
    print(out)

    return out

定义数据层以及获取分类器：

paddle.enable_static() #不输入就会报错
# 定义输入数据， lod_level不为0指定输入数据为序列数据
words = fluid.data(name='words', shape=[None,1], dtype='int64', lod_level=1)
# print(type(character_train_list[1][1]))
character_train=fluid.data(name='character_train', shape=[None,1], dtype='float32', lod_level=1)
label = fluid.data(name='label', shape=[None,1], dtype='int64')

# 获取数据字典长度
dict_dim = get_dict_len(dict_path)
print("!!",dict_dim)

# 获取分类器
model = lstm_net(words,character_train,dict_dim)

正式训练：

EPOCH_NUM=10                                        #训练轮数
model_save_dir = 'C:/Users/15186/Desktop/谣言2/infer_model/' #模型保存路径

data_character=[]
for (ida,i),(idb,j) in zip(enumerate(character_train_reader()),enumerate(train_reader())):

    temp_a = list(i[ida])
    temp_b = list(j[idb])
    temp_b.append(temp_a)
    # print(temp_b)
    data_character.append(tuple(temp_b))

#     print("++++++++++++++++++++++++++")
print(data_character)

# 开始训练
for pass_id in range(EPOCH_NUM):
    # 进行训练
#     print("pass_id",pass_id)
    for batch_id, data in enumerate(train_reader()):   #enumerate函数可以把一个list变成索引-元素对（也是在迭代）
#         print(batch_id)
        print("#################################################")
        train_cost, train_acc = exe.run(program=fluid.default_main_program(),
                                         feed=feeder.feed(data_character), #这里是往网络里面喂数据
                                         fetch_list=[avg_cost, acc])
        all_train_iter=all_train_iter+BATCH_SIZE
        all_train_iters.append(all_train_iter)
        all_train_costs.append(train_cost[0])
        all_train_accs.append(train_acc[0])

        if batch_id % 100 == 0:
            print('Pass:%d, Batch:%d, Cost:%0.5f, Acc:%0.5f' % (pass_id, batch_id, train_cost[0], train_acc[0]))
  

# 保存模型
if not os.path.exists(model_save_dir): 
    os.makedirs(model_save_dir) 
fluid.io.save_inference_model(model_save_dir, 
                            feeded_var_names=[words.name], 
                            target_vars=[model], 
                            executor=exe)
print('训练模型保存完成！') 

draw_process("train",all_train_iters,all_train_costs,all_train_accs,"trainning cost","trainning acc")
draw_process("eval",all_eval_iters,all_eval_costs,all_eval_accs,"evaling cost","evaling acc")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ty94666 2022-03-24 07:40
关注
你传入的张量是252，2
但需要的是21，2
考虑使用reshape把维度变化一下
飞桨的框架我没用过，pytorch是这么操作的，你搜一搜类似的改变张量shape的函数

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

paddle 卷积神经网络训练时报错InvalidArgumentError: The input tensor X of SumOp must have same shape.. paddle 深度学习神经网络
2022-03-24 03:18

回答 1 已采纳你传入的张量是252，2但需要的是21，2考虑使用reshape把维度变化一下飞桨的框架我没用过，pytorch是这么操作的，你搜一搜类似的改变张量shape的函数
conv2d(): argument 'input' (position 1) must be Tensor, not Tensor，不知道怎么解决。 python 人工智能有问必答
2021-09-28 09:26

回答 2 已采纳 x=nn.Conv2d(1, 256, kernel_size=7, stride=2, padding=3, bias=False)(input1)请问(input1)是什么？python语法中好似
使用paddle框架部署深度学习在多块gpu上报错： AttributeError: module 'paddle.fluid.contrib' has no attribute 'reader' paddle python 深度学习
2022-08-31 14:54

回答 1 已采纳既然整的是动态图就抛弃fluid吧，这个应该是paddle2中逐步移除了。你改用paddle1.7，1.8等版本试一下吧。
深入浅出PaddlePaddle函数——paddle.sum
2023-04-03 20:15

von Neumann的博客 paddle.sum(x, axis=None, dtype=None, keepdim=False, name=None)
docker cp命令使用报错：Error: No such container:path bash docker linux 有问必答
2022-03-12 22:30

回答 4 已采纳因该是遇到了只读文件系统（不知道咋直接复制出来，可以试试修改权限，不过很少遇到就没有弄过），你可以先进入容器，把你要的文件cp到容器的根目录下，然后在宿主机上用docker cp复制出来。
生成条形码PyCharm 环境下可正常运行，利用Pyinstaller打包后系统报错OSError: cannot open resource，如何解决？(语言-python) python
2022-05-05 04:43

回答 3 已采纳我估计问题出在barcode.writer.FONT=os.path.join('AdobeGothicStd-Bold.otf')这一行，因为报错提示信息是关于字体的，而你使用的这个字体并不是系统默
【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
PaddlePaddle: ValueError: (InvalidArgument)
2021-06-01 14:50

大大大__的博客 PaddlePadValueError: (InvalidArgument) element count should greater than 0, but recei 问题在用PyCharm运行PaddleDetetion代码时，遇到了问题。代码运行一段时间后，报如下错： Process finished with exit ...
安装paddlehub失败和git仓库有关？ git paddlepaddle python
2022-07-01 09:19

回答 1 已采纳已经自己解决了发现没有在anaconda的虚拟环境下安装paddlepaddle安装后用上面的指令后报了一些six packaging的一些错这个csdn里有解决方法完成后截图是这样的（pi
paddle数据封装问题，经过一个class类，能得到什么结果？ paddle python 人工智能
2022-08-06 10:12

回答 2 已采纳这样才能返回想要的index数据，记得采纳哈 from paddle.io import Dataset from paddle.io import DataLoader import numpy a
PaddleDetection的判别原理是什么？ paddle 人工智能计算机视觉
2022-10-17 18:54

回答 4 已采纳做深度学习需要大量的标注数据，我们按照什么样的标准去标注数据，模型就会学习什么样的判别标准。你所描述的错误识别现象，很有可能是模型训练不到位（具体原因可能为：1、训练数据中没有描述这种状态；2、数据标
pytorch神经网络之optuna参数搜索--以野生蓝莓产量预测比赛为例
2023-05-10 21:41

淡写 ╮ 青春的博客在本文中将搭建一个简单的pytorch神经网络，从而对野生蓝莓产量进行预测，模型使用optuna包对参数进行自动搜索，同时也以可视化的形式对参数搜索结果进行展现。本文包含详细完整的代码和代码说明。
android.view.WindowLeaked: 窗体泄露，还是因为别的问题？ android-studio
2019-01-31 17:27

回答 1 已采纳一般会发生在Activity 与Dialog的显示，如果Activity先于dialog被关闭掉就会产生android.view.WindowLeaked，你看下你那些方法有关闭Activity的吗？
paddle卷积BN合并
2021-11-08 10:38

BUAA_小胡的博客 """"Fuse conv bn file.""" import copy import paddle import paddle.nn as nn ... """Given the model and the name of a layer, find the parent layer and the sub_name of the layer. For example, if name...
paddle gaussian_blur2d
2022-04-15 17:36

蜉蝣之翼❉的博客参考代码 https://github.com/kornia/kornia/blob/master/kornia/filters/kernels.py ...转成paddle版本实现以下函数 _compute_padding normalize_kernel2d get_gaussian_kernel1
深入浅出TensorFlow2函数——tf.math.reduce_sum
2023-04-03 20:36

von Neumann的博客 tf.math.reduce_sum( input_tensor, axis=None, keepdims=False, name=None )
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月24日

悬赏问题

¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵
¥15 cfx离心泵非稳态计算

paddle 卷积神经网络训练时报错InvalidArgumentError: The input tensor X of SumOp must have same shape..

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新