怎样用transformer测试

Transformer预测
我现在跑通了Transformer的源码，
数据集是Multi30k德语-英语翻译，
训练结束后生成了几个.pt文件，
请问一下，我现在想进行测试，就是给它一个英语，怎样才能翻译成德语

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

玥轩_521 2023-06-15 15:06

关注

恭喜你已经成功训练 Transformer 模型，下面是如何进行翻译的步骤：

1.准备测试文本数据；
2.加载预训练的模型，并设置为评估模式；
3.对测试文本数据进行预处理，包括分词、生成输入张量等；
4.将预处理后的输入张量输入给模型，利用模型对其进行翻译；
5.将输出结果进行后处理，包括解码、反标记化等；
6.输出翻译结果。

下面是一个简单的 Python 代码示例：

import torch
from torchtext.data.metrics import bleu_score
import spacy

# 加载预训练的模型
model_path = "path/to/model.pt"
model = torch.load(model_path)

# 设置为评估模式
model.eval()

# 预处理输入文本
input_sentence = "This is a test sentence."
nlp = spacy.load("en_core_web_sm")
tokenized = [tok.text for tok in nlp.tokenizer(input_sentence)]
SRC = Field(tokenize = "spacy",init_token = '<sos>',eos_token = '<eos>',lower = True,batch_first = True,)
SRC.vocab = SRC.vocab.load('./Multi30k-vocab/transformer_spacy_multi30k_vocabulary.pt')
SRC = SRC.cuda()
input_tensor = SRC.process([tokenized]).cuda()

# 计算翻译结果
with torch.no_grad():
    outputs = model(input_tensor)
    outputs = outputs.argmax(dim=-1)
    outputs = outputs.cpu().numpy().tolist()[0]

# 后处理翻译结果
TRG = Field(tokenize = "spacy",init_token = '<sos>',eos_token = '<eos>',lower = True,batch_first = True,)
TRG.vocab = TRG.vocab.load('./Multi30k-vocab/transformer_spacy_multi30k_vocabulary.pt')
TRG = TRG.cuda()
translated_sentence = ' '.join([TRG.vocab.itos[idx] for idx in outputs if idx not in [TRG.vocab.stoi[TRG.init_token], TRG.vocab.stoi[TRG.eos_token]]])

# 输出翻译结果
print(translated_sentence)