深度学习XLnet模型出现问题，如何解决

在运行XLnet进行文本分类的时候，出现了下面的问题，该如何解决，请大家赐教：

def tokenize(text):
    tokenized = tokenizer(text,
              padding=True,
              truncation=True,
              return_tensors='tf',
              return_token_type_ids=False,
              return_attention_mask=False,
              verbose=True)
    return tokenized

x_train_enc = tokenize(x_train)
x_test_enc = tokenize(x_test)

y_train_enc_one_hot = to_categorical(y_train_enc, num_classes=num_classes)
y_test_enc_one_hot = to_categorical(y_test_enc, num_classes=num_classes)

ValueError Traceback (most recent call last)
/tmp/ipykernel_10776/2763515379.py in
11 return tokenized
12
---> 13 x_train_enc = tokenize(x_train)
14 x_test_enc = tokenize(x_test)
15

/tmp/ipykernel_10776/2763515379.py in tokenize(text)
8 return_token_type_ids=False,
9 return_attention_mask=False,
---> 10 verbose=True)
11 return tokenized
12

/environment/miniconda3/lib/python3.7/site-packages/transformers/tokenization_utils_base.py in call(self, text, text_pair, add_special_tokens, padding, truncation, max_length, stride, is_split_into_words, pad_to_multiple_of, return_tensors, return_token_type_ids, return_attention_mask, return_overflowing_tokens, return_special_tokens_mask, return_offsets_mapping, return_length, verbose, **kwargs)
2391 if not _is_valid_text_input(text):
2392 raise ValueError(
-> 2393 "text input must of type str (single example), List[str] (batch or single pretokenized example) "
2394 "or List[List[str]] (batch of pretokenized examples)."
2395 )

ValueError: text input must of type str (single example), List[str] (batch or single pretokenized example) or List[List[str]] (batch of pretokenized examples).

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2022-01-08 13:49
关注
参数text应该是一个字符串类型或字符串列表形式。检查一下传入的参数text。
试试改一下：
for i, text in enumerate(df['abstract2'].tolist())

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

深度学习XLnet模型出现问题，如何解决 xlnet 有问必答深度学习自然语言处理
2022-01-07 20:46

回答 1 已采纳参数text应该是一个字符串类型或字符串列表形式。检查一下传入的参数text。试试改一下：for i, text in enumerate(df['abstract2'].tolist())
如何解决XLnet分类存在的问题？ xlnet 有问必答深度学习自然语言处理
2022-01-10 19:57

回答 2 已采纳检查一下传入的tokenizer参数，导致抛出None值无encode_plus属性错误。
怎么加载从huggingface拉下来的模型代码 pytorch 深度学习自然语言处理
2022-02-24 14:02

回答 2 已采纳首先huggingface上的预训练模型都是有示例代码的，博主贴的四行代码的中的前两行会检查你本地有没有XLNet这个模型，若没有的话就会从huggingface上下载相应的模型到一个指定的目录下去，
XLNet模型详解
2021-11-15 11:03

lppfwl的博客这两天在网上找了很多博客资料看，有些博文写的很好，但总感觉还是漏了一点东西，让我一直有些地方搞不懂，最终还是看了原论文（偷懒不行啊。。。）。这里就记录一下我的理解，肯定还是有不全的...XLNet提出的目的就是
【AI大模型】深度学习基础
2024-05-29 22:13

AI大模型探索者的博客所谓模型，就是一个包含了大量未知参数的函数，所谓训练，就是通过大量的数据去迭代逼近这些未知参数的最优解。机器学习中的典型任务类型：分为（Classification）和分类任务：是对离散值进行预测，根据每个样本的值...
自然语言处理中的XLNet模型
2024-01-18 02:07

禅与计算机程序设计艺术的博客自然语言处理(NLP)是计算机科学和人工智能的一个分支，旨在让计算机理解和生成人类语言。自然语言处理的一个重要任务是文本分类，即根据文本内容将其分为不同的类别。传统的文本分类方法通常使用手工设计的特征，但...
基于深度学习的情感分析.zip
2024-03-29 08:36

《基于深度学习的情感分析》是针对人工智能领域，特别是深度学习技术在情感分析中的应用进行的一次深入探讨。情感分析，也称为情绪识别或意见挖掘，是自然语言处理（NLP）的一个重要分支，旨在理解、解释和提取文本...
最适合入门的100个深度学习项目
2022-10-17 16:30

海洋之心的博客本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集。
大白话聊聊“深度学习”和“大模型”
2024-06-04 21:00

爱吃鸡翅膀咯的博客与传统的为解决特定任务、硬编码的软件程序不同，机器学习是用大量的数据来“训练”，通过各种算法从数据中学习如何完成任务。
人工智能-项目实践-知识蒸馏-基于 Tensorflow，仿 Scikit-Learn 设计的深度学习自然语言处理框架
2023-12-26 21:31

人工智能-项目实践-知识蒸馏-基于 Tensorflow，仿 Scikit-Learn 设计的深度学习自然语言处理框架兼容 Tensorflow1.x/2.x 的高层封装 (Transformer/GPT-2/BERT/ALBERT/UniLM/XLNet/ELECTRA 等)，使用简单的代码完成...
深度学习中的大模型「幻觉」问题：解析、原因及未来展望
2024-06-04 11:54

AAI机器之心的博客大模型幻觉是指在深度学习领域中，尤其是涉及大型神经网络时，模型展现出在理论上不应具备的性能或能力。这种现象可能导致误导性的结果，表现为在训练数据上过度拟合，使得模型在未曾见过的数据上表现异常优秀。
人工智能和机器学习有什么关系？大模型是什么？你知道吗？
2024-05-30 20:33

健忘的派大星的博客大模型也叫大语言模型，是一个通过分析和学习大量的文本数据来理解和生成人类语言的复杂计算机程序，是上边深度学习的媒介，通过大语言模型来实现深度学习。举一个形象的例子说明大模型在机器学习中的工作原理。你在...
AI大模型：一文搞懂人工智能、机器学习、深度学习以及大模型
2024-07-22 15:27

Android女王的博客 AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更...
深度学习之文本分类模型-基于transformer
2024-06-10 17:43

小城哇哇的博客 GPT是由openAI提出的一种算法思想\[2\]，其主要思想是通过在大规模的预料上进行模型的训练，然后在特定任务上进行为调。所以其总体思想分为无监督的训练和有监督的微调。
XLNet详解
2023-03-06 10:59

ZHUY-JUN的博客 XLNet详解
一文回顾深度学习发展史上最重要经典模型
2022-02-07 18:58

lqfarmer的博客我将介绍一小部分技术，这些技术涵盖了解现代深度学习研究所必需的许多基本知识。如果你是该领域的新手，那么这是一个很好的起点。深度学习是一个瞬息万变的领域，大量的研究论文和想法可能会令人不知所措。即使...
大模型：深度学习领域的“巨无霸”_深度学习大模型
2024-07-11 09:22

AI大模型学习不迷路的博客【一一AGI大模型学习所有资源获取处一一】①人工智能/大模型学习路线②AI产品经理入门指南③大模型方向必读书籍PDF版④超详细海量大模型实战项目⑤LLM大模型系统学习教程⑥640套-AI大模型报告合集。
深度学习系列资料总结
2022-07-17 11:03

GoAI的博客说明本系列深度学习资料集合包含机器学习、深度学习等各系列教程，主要以计算机视觉资料为主，包括图像...手写机器学习笔记github机器学习算法公式推导以及numpy实现github人工智能相关术语link。..................
推荐人工智能领域十大类专业好用的深度学习预训练模型
2023-03-27 15:35

源代码杀手的博客深度学习领域出现了许多优秀的预训练模型。
【深度学习】预训练语言模型-BERT
2023-03-06 16:01

DonngZH的博客 BERT是一种预训练语言模型（pre-trained language model, PLM），其全称是Bidirectional Encoder Representations from Transformers。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月7日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

深度学习XLnet模型出现问题，如何解决

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新