深度学习roberta模型出现问题，如何解决

在运行roberta进行文本分类的时候，出现了下面的问题，该如何解决，请大家赐教：

class MLMDataset(torch.utils.data.Dataset):
    def __init__(self, is_train, texts, tokenizer):
        self.is_train = is_train
        self.tokenizer = tokenizer
        if self.is_train:
            self.data = texts
        else:
            self.data = texts
        ### only use portion of data
        length = int(len(self.data)/1)
        self.data = self.data[:length]
        ###

    def __getitem__(self, idx):
        item = self.tokenizer(self.data[idx], padding='max_length', is_split_into_words = False,truncation=True, return_tensors="pt")
        
        item['labels'] = item['input_ids'].clone()
        
        probability_matrix = torch.full(item['labels'].shape, 0.15)
        special_tokens_mask = [self.tokenizer.get_special_tokens_mask(val, already_has_special_tokens=True) for val in item['labels'].tolist()]
        probability_matrix.masked_fill_(torch.tensor(special_tokens_mask, dtype=torch.bool), value=0.0)
        masked_indices = torch.bernoulli(probability_matrix).bool()
        item['labels'][~masked_indices] = -100

        # 80% of the time, we replace masked input tokens with tokenizer.mask_token ([MASK])
        indices_replaced = torch.bernoulli(torch.full(item['labels'].shape, 0.8)).bool() & masked_indices
        item['input_ids'][indices_replaced] = self.tokenizer.convert_tokens_to_ids(self.tokenizer.mask_token)

        # 10% of the time, we replace masked input tokens with random word
        indices_random = torch.bernoulli(torch.full(item['labels'].shape, 0.5)).bool() & masked_indices & ~indices_replaced
        random_words = torch.randint(len(self.tokenizer), item['labels'].shape, dtype=torch.long)
        item['input_ids'][indices_random] = random_words[indices_random]

        # The rest of the time (10% of the time) we keep the masked input tokens unchanged
        item['input_ids'] = item['input_ids'][0]
        item['attention_mask'] = item['attention_mask'][0]
        item['labels'] = item['labels'][0]
        return item

    def __len__(self):
        return len(self.data)

datagram

运行结果及报错内容

ValueError: text input must of type str (single example), List[str] (batch or single pretokenized example) or List[List[str]] (batch of pretokenized examples).

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2022-01-18 09:41
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为您补发到账户。

因为有问必答VIP体验卡有效期仅有1天，您在需要使用的时候【私信】联系我，我会为您补发。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何解决IndexError: only integers, slices这类问题 python 分类有问必答深度学习
2022-01-06 15:11

回答 1 已采纳 x_train['abstract2']，可作为字典键取值或者选取数据框的列。如果x_train是一个数组（或列表），不能用字符去作为索引，应该是整数或切片。
2021年了，有哪些稳压bert和roberta的预训练模型？人工智能机器学习深度学习神经网络自然语言处理
2021-01-20 14:38

回答 1 已采纳 https://arxiv.org/abs/2106.11483
Hugging Face下载NLP模型出错人工智能自然语言处理
2022-07-21 21:48

回答 1 已采纳用管理员模式运行 cmd 或者 powershell，然后再运行 jupyter 试试。或者开启开发者模式：https://consumer.huawei.com/en/support/conten
NLP的Scikit学习风格模型微调-Python开发
2021-05-25 18:08

Finetune当前支持以下模型的TensorFlow实现：“来自BERT：深度双向变压器的预训练以进行语言理解的BERT”来自“ RoBERTa：经过严格优化的BERT预训练方法”的RoBERTa，来自“通过生成预言改善语言理解”的GPT。...
多标签文本分类模型训练后在验证集上F1值为0 pytorch 分类自然语言处理
2023-04-16 13:55

回答 2 已采纳你好，根据你提供的信息，可能有以下几个原因：数据集问题：可能训练集和验证集的数据分布不一致，导致模型在验证集上表现不佳。建议检查一下数据集是否存在标签分布不均衡的情况。模型问题：可能预训练模型Ro
pytorch 加载本地 roberta 模型
2020-10-12 11:42

guyu1003的博客在利用Torch模块加载本地roberta模型时总是报OSERROR，如下： OSError: Model name './chinese_roberta_wwm_ext_pytorch' was not found in tokenizers model name list (roberta-base, roberta-large, roberta-...
Python深度学习：【模型系列】 Transformer模型有哪些著名的变种
2024-04-15 09:24

惊鸿若梦一书生的博客 Transformer模型自从2017年...这些变种模型在不同的任务和领域中被广泛使用，包括自然语言处理、计算机视觉和多模态学习。这些变体展示了Transformer架构的灵活性和强大能力，使得它成为了现代AI系统中的一个基石技术。
基于深度学习BERT的触发词抽取、论元抽取、属性抽取项目python源码+项目说明+数据.zip
2024-01-09 20:04

基于深度学习BERT的触发词抽取、论元抽取、属性抽取项目python源码+项目说明+数据.zip 主要思路：这是一个基于深度学习的事件抽取。将任务分割为触发词抽取，论元抽取，属性抽取。具体而言是论元和属性的抽取结果...
【NLP】第4章从头开始预训练 RoBERTa 模型
2022-09-25 10:30

Sonhhxg_柒的博客 KantaiBERT 是一个类似 DistilBERT 的模型，因为它具有相同的 6 层和 12 个头的架构。您可以加载现有数据集或创建自己的数据集，具体取决于您的目标。您将有足够的变压器知识来面对工业 4.0 的挑战，即使用强大的预...
【深度学习】预训练语言模型-BERT
2023-03-06 16:01

DonngZH的博客 BERT是一种预训练语言模型（pre-trained language model, PLM），其全称是Bidirectional Encoder Representations from Transformers。
深度学习系列资料总结
2022-07-17 11:03

GoAI的博客说明本系列深度学习资料集合包含机器学习、深度学习等各系列教程，主要以计算机视觉资料为主，包括图像识别、分类、检测、分割等，内容参考Github及网络资源，仅供个人学习。深度学习定义一般是指通过训练多层网络...
从BERT到ROBERTA：预训练语言模型的优化之路
2023-03-14 13:57

Chaos_Wang_的博客自从深度学习在自然语言处理领域得到广泛应用以来，Transformer模型一直是自然语言处理的重要研究方向。2017年，谷歌推出了Transformer模型的创新之作——BERT，在自然语言处理领域引起了极大的关注。2020年，...
深度学习实战（6）如何fine-tuning Roberta
2020-09-15 10:54

icebird_craft的博客对Roberta进行fine-tuning
一文回顾深度学习发展史上最重要经典模型
2022-02-07 18:58

lqfarmer的博客我将介绍一小部分技术，这些技术涵盖了解现代深度学习研究所必需的许多基本知识。如果你是该领域的新手，那么这是一个很好的起点。 深度学习是一个瞬息万变的领域，大量的研究论文和想法可能会令人不知所措。即使...
学习笔记：深度学习（6）——基于深度学习的语言模型
2022-04-25 23:10

新四石路打卤面的博客预训练模型梳理：从NNLM到词嵌入、从ELMo到GPT&BERT，以及After GPT&BERT。
深度学习：BERT模型
2018-12-18 15:48

-柚子皮-的博客 BERT出自的全称是Bidirectional Encoder Representation from Transformers，即...模型的主要创新点都在pre-train方法上，即用了Masked LM和Next Sentence Prediction两种方法分别捕捉词语和句子级别的representation。
【深度学习】基于BERT模型的情感分类（附实战代码）
2024-02-15 08:58

Yang-ai-cao的博客情感分类是一个快速发展的研究领域，尽管众多模型和数据集在二分类任务中显示出很高的准确性，但细粒度的情感分类任务仍然是一个很大改进空间的领域。分析SST-5数据集，Munikar等人的先前工作表明，嵌入工具BERT允许...
Pytorch预训练模型下载慢解决方式
2021-09-10 10:40

mez_Blog的博客最近在使用与训练网络模型ResNet50 Faster R-CNN的时候，发现系统自带的下载方式是非常慢的，而且等待好久一段时间后出现： TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有...
【深度学习】干货！小显存如何训练大模型
2022-03-02 12:00

风度78的博客之前Kaggle有一个Jigsaw多语言毒舌评论分类[1]比赛，当时我只有一张11G显存的1080Ti，根本没法训练SOTA的Roberta-XLM-large模型，只能遗憾躺平。在这篇文...
由浅入深尝试图书分类任务实战（特征工程+GBDT、机器学习模型、深度学习模型）
2020-07-31 16:32

fond_dependent的博客在本项目中，我们主要来解决文本单标签的任务。数据源来自于京东电商，任务是基于图书的相关描述和图书的封面图片，自动给一个图书做类目的分类。这种任务也叫作多模态分类。在这个实战中，我掌握学习到以下的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

深度学习roberta模型出现问题，如何解决

在运行roberta进行文本分类的时候，出现了下面的问题，该如何解决，请大家赐教：

datagram

运行结果及报错内容

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新