Bert中文文本分类输出

基于Pytorch框架的Bert模型中文文本分类，输出结果是如下图所示的张量Tensor([151])等，我的分类类别是0、1，一直到6这样的数字标签，请问怎么从输出的张量结果看对应的预测类别标签？
这样输出的结果是正确的吗？
谢谢回答的大家！

部分模型引用代码如下：

with open('data_for_classify.txt','r',encoding='utf-8') as f:
    for line in f.readlines():
        new_sentences = line.strip()
        input_ids, seq_len, attention_mask = preprocess(new_sentences)
        preprocessed_sentences = preprocess(new_sentences)
        logits = bert_model.forward(preprocessed_sentences[0], attention_mask=preprocessed_sentences[2])[1]
        #preprocessed_sentences = preprocess(new_sentences)
        #logits = bert_model.forward()
        probabilities = torch.nn.functional.softmax(logits, dim=-1)
        predicted_classes = torch.argmax(probabilities, dim=-1)
        print(predicted_classes)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-04-22 08:12
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
这个问题的回答你可以参考下: https://ask.csdn.net/questions/7540840
这篇博客也不错, 你可以看下由浅入深，带你搞懂 Pytorch 中的张量 tensor 是什么
除此之外, 这篇博客: Pytorch中使用Bert预训练模型，并给定句子得到对应的向量中的 修改输入形式 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

Bert的输入要有三个向量：（1）input_ids （2）token_type_ids （3）attention_mask。这三个向量可以通过一行代码获得：

sentenceA = '等潮水退去，就知道谁没穿裤子' text_dict = tokenizer.encode_plus(sentenceA, add_special_tokens=True, return_attention_mask=True)

您还可以看一下龙良曲老师的深度学习与PyTorch入门实战教程课程中的 Tensor运算小节, 巩固相关知识点
以下回答来自chatgpt:
针对问题中的张量输出结果，可以使用PyTorch中的item()方法获取张量中的值，并使用近似函数进行取整操作得到最终的预测类别标签。

具体实现步骤如下：

将输出的张量中的值取出，用item()方法将其转换为标量。

对取出的标量进行四舍五入的操作，使用Python内置的round()函数实现。

将四舍五入后的结果转换为整数类型，使用Python内置的int()函数实现。

将整数类型的结果作为最终的预测类别标签返回。

代码实现如下：

# 模型预测 with torch.no_grad(): output = model(input_ids, attention_mask, token_type_ids) logits = output[0] preds = torch.argmax(logits, dim=1) pred_label = int(round(preds.item())) print("预测类别标签为：", pred_label)

其中，preds.item()用于获取张量中的值，int()函数用于将四舍五入后的标量转换为整数类型，round()函数用于实现四舍五入操作。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

# 基于BERT的文本分类
2025-04-09 17:06

@MrLiu的博客数据集自定义类型二分类（正面/负面）样本量训练集 + 验证集 + 测试集文本长度平均x字（最大x字）领域商品评论、影视评论# 加载数据集# 输出：{'text': '这个手机性价比超高，拍照效果惊艳！
深度学习项目3：基于 BERT的文本分类任务
2025-02-15 15:30

半个辣椒瓜瓜的博客这个任务是基于BERT模型构建自己的模型对酒店评论进行情感分类（如正面评价或负面评价）。包括数据处理、模型构建、模型训练、模型评估与保存四个部分。
pytorch-bert文本分类
2021-06-18 14:50

为了利用BERT进行文本分类，我们需要加载预训练的BERT模型，然后添加一个或多个全连接层作为分类头，用于输出类别概率。PyTorch的`transformers`库提供了官方实现的BERT模型，可以轻松地与自定义模型结构结合。在...
手把手教你使用 BERT 进行文本分类——代码逐行注释讲解
2024-12-30 14:16

我爱学大模型的博客 BERT（Bidirectional Encoder Representations from Transformers，全称“基于双向编码器表示的变换器”）是 Google 开发的一种强大的自然语言处理（NLP）模型，基于 Transformer 的深度神经网络架构。
Bert模型实现中文新闻文本分类
2024-06-20 11:19

蚂蚁*漫步的博客 Bert模型实现文本分类，代码实现。
基于BERT的文本分类——附-简单的示例代码
2024-01-29 17:14

技术宅学长的博客 BERT通过在大规模文本语料上进行预训练，学习了深层次的语言表示，然后可以通过微调用于各种下游任务，包括文本分类。文本分类是一个常见的自然语言处理任务，它涉及将文本分为不同的类别或标签。
基于BERT的中文文本分类：将Bert预训练模型进行微调以应用于中文文本分类
2024-04-19 10:08

co0lro0t的博客本文章是作者对基于BERT的中文文本分类的开源项目进行多次的运行测试、一步步调试过程中写下的分析文档，主要是针对该深度学习项目的四个关键文件（或四个模块）进行的分析和总结。
BERT实现文本标签分类任务
2023-06-29 22:13

安徒生在ACL讲一千零一夜的博客（通过在bert模型中配置）导入数据集与分类类别名单。
基于BERT做中文文本分类(情感分析)
2019-10-07 16:39

我开心呀的博客 BERT是一种预训练语言表示的方法，这意味着我们在大型文本语料库（例如Wikipedia）上训练通用的“语言理解”模型，然后将该模型用于我们关心的下游NLP任务，BERT优于之前的方法，因为它是第一个用于预训练NLP的无...
基于 BERT 的文本分类任务（bert实战+问答）
2025-03-03 16:08

bug520iforever的博客通过同时考虑前后两个方向的特征，增强了模型的理解能力。在 Transformer 训练中，由于模型参数...，该模型已在大规模语料库上预训练，只需要在我们的酒店评论数据集上进行微调，就能快速得到高准确率的情感分类结果。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 3月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

Bert中文文本分类输出

1条回答 默认 最新

问题事件

1条回答默认最新