tenforflow调用模型权重预测测试集问题？

求教各位大佬，就是在训练模型时喂给模型有（x,y），在预测时候只喂x_test ,我用tf官网给出的一份代码试了试，有问题

def train_step(inp, tar):
    tar_inp = tar[:, :-1]
    tar_real = tar[:, 1:]

    enc_padding_mask, combined_mask, dec_padding_mask = create_masks(inp, tar_inp)

    with tf.GradientTape() as tape:
        predictions, _ = transformer(
                inp, tar_inp, 
                True, 
                enc_padding_mask, 
                combined_mask, 
                dec_padding_mask
            )
        loss = loss_function(tar_real, predictions)
    
    gradients = tape.gradient(loss, transformer.trainable_variables)    
    optimizer.apply_gradients(zip(gradients, transformer.trainable_variables))
    
    
    train_loss(loss)


for epoch in range(config.EPOCHS):
    start = time.time()

    train_loss.reset_states()

    for (batch, (inp, tar)) in enumerate(train_dataset):
        
        train_step(inp, tar)

            # 55k samples
            # we display 3 batch results -- 0th, middle and last one (approx)
            # 55k / 64 ~ 858; 858 / 2 = 429
        if batch % 429 == 0:
            print (f'Epoch {epoch + 1} Batch {batch} Loss {train_loss.result()}')
    if (epoch + 1) % 5 == 0:
        ckpt_save_path = ckpt_manager.save()
        print ('Saving checkpoint for epoch {} at {}'.format(epoch+1, ckpt_save_path))
    
    
    print ('Epoch {} Loss {:.4f}'.format(epoch + 1, train_loss.result()))
    

    print ('Time taken for 1 epoch: {} secs\n'.format(time.time() - start))

以上为训练代码，训练出权重后，我调用权重预测数据出了问题

results=[]
for (batch,inp) in enumerate (test_dataset):
    encoder_input=inp
    output=[]
    tar_inp = tar[:, :-1]
    
    enc_padding_mask, combined_mask, dec_padding_mask = create_masks(encoder_input,output)
    predictions, _ = transformer(
                inp, tar_inp, 
                True, 
                enc_padding_mask, 
                combined_mask, 
                dec_padding_mask
            )
    results.append(predictions)

出的问题是

InvalidArgumentError: slice index 1 of dimension 0 out of bounds. [Op:StridedSlice] name: strided_slice/

求教各位大佬，多谢！！！！！！！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-07-16 09:31
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
根据您提供的代码片段和报错信息，问题出在您的预测代码中。您在预测时使用了`tar[:, :-1]`这个操作，但是在预测阶段并没有`tar`这个输入数据。这个操作是用于在训练中获取目标序列中除最后一个词外的所有词，但在预测中不需要这样做。以下是修改后的预测代码示例：
results = [] for (batch, inp) in enumerate(test_dataset): encoder_input = inp output = tf.expand_dims([START_TOKEN], 0) # Assuming you have a START_TOKEN defined for i in range(MAX_LENGTH): # MAX_LENGTH is the maximum length for output sequence enc_padding_mask, combined_mask, dec_padding_mask = create_masks(encoder_input, output) predictions, _ = transformer( encoder_input, output, False, enc_padding_mask, combined_mask, dec_padding_mask ) predictions = predictions[:, -1:, :] # Get the last prediction predicted_id = tf.cast(tf.argmax(predictions, axis=-1), tf.int32) if predicted_id == END_TOKEN: # Assuming you have an END_TOKEN defined break output = tf.concat([output, predicted_id], axis=-1) results.append(output)

在这个修改后的代码中，我们针对每个输入数据进行预测，动态根据模型的输出生成下一个单词，并将其添加到输出序列中。请确保定义了START_TOKEN和END_TOKEN，以便在生成序列时使用。另外，根据您的具体情况可能需要做一些调整，比如设置合适的MAX_LENGTH，确保模型输出的序列不会无限增长等。希望这能帮助解决您的问题，如有其他疑问，请随时询问。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

yolov13模型调用
2025-06-26 20:58

3. 模型调用步骤：在使用yolov13（此应为误写，实际上可能是YOLOv3）模型进行目标检测时，需要遵循以下步骤：加载预训练权重、加载配置文件、设置模型参数、进行图像预处理、执行前向传播（即模型推理）和后处理（如...
人工智能基于Gemini多模态模型的API调用与代码实现：办公自动化场景下的智能应用开发
2025-11-16 14:12

内容概要：本文深入剖析了谷歌开发的先进人工智能模型Gemini，涵盖其核心概念、关键技术、应用场景及未来发展趋势。Gemini具备强大的语言理解与生成能力，支持文本、图像、音频、视频等多模态数据处理，具有良好的...
《AI大模型应用》--AI模型接口管理与分发系统，支持将多种大模型转为OpenAI格式调用.zip
2024-07-10 18:48

AI模型接口管理与分发系统，支持将多种大模型转为OpenAI格式调用、支持Midjourney Proxy、Suno、Rerank，兼容易支付协议，仅供个人或者企业内部管理与分发渠道使用，请勿用于商业用途，本项目基于One API二次开发。...
《AI大模型》--智谱Ai大模型.zip
2024-03-22 16:23

人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结...
python接口调用已训练好的caffe模型测试分类方法
2020-09-18 18:20

Caffe是一个深度学习框架，由伯克利人工智能研究(BAIR)实验室开发，它特别适合于卷积神经网络（CNNs）和图像处理。Caffe采用C++编写，但它的Python接口让使用者可以方便地用Python语言进行模型训练和测试。首先，...
《AI大模型应用》--调用 OpenAI API 实现的简单聊天对话，支持连续对话.zip
2024-07-19 17:15

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
《AI大模型》--百度千帆大模型+SpringBoot进行简单的AI对话开发.zip
2024-03-22 16:24

人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结成果，希望可以帮到大家，有疑问欢迎随时沟通~ 人工智能学习总结...
《AI大模型应用》--百度文心一言 API 的 UE5 插件。.zip
2024-07-25 17:14

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
《AI大模型应用》--统一的API接口调用多个后端服务，统一转换为 OpenAI 格式，支持负载均衡.zip
2024-07-19 17:15

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
中国人工智能系列白皮书-大模型技术-2023版免费下载
2024-01-31 15:10

### 中国人工智能系列白皮书——大模型技术(2023版)核心知识点解析 #### 一、大模型技术概述 **1.1 大模型技术的发展历程** 大模型技术的发展可以追溯到深度学习兴起之时，特别是自2012年以来，随着计算能力的...
没有解决我的问题, 去提问

tenforflow调用模型权重预测 测试集问题？

1条回答 默认 最新

tenforflow调用模型权重预测测试集问题？

1条回答默认最新