T5调用generate中得到的logit为None

您好，很抱歉打扰您。有一个关于T5模型的问题想请教您一下！
使用T5模型调用gen_seqs = accelerator.unwrap_model(model).generate(**batch['context'],max_new_tokens=args.max_gen_len,no_repeat_ngram_size=3)函数后，在其#4中的input_ids得到返回值tensor([[0],\n [o],\n[0],\n[0]], device='cuda:0')。于是乎后面在greedy_search(input_ids..)中得到的logit为None而报错，这是什么情况呀？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间代码工作室 Java领域优质创作者 2024-04-07 13:11
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
根据描述，出现了两个问题：第一个问题是gen_seqs调用后返回的input_ids是一个形状为[4,1]的tensor，其中有一个元素为字符'o'；第二个问题是在greedy_search函数中使用这个input_ids时出现了logit为None的错误。以下是建议的解答格式：
针对第一个问题，可以进行如下解答：根据给出的情况，在使用T5模型调用gen_seqs函数之后得到的input_ids张量中出现了非法字符'o'，它是无法被T5模型的解码器处理的。因此这可能会导致后续的计算出错。建议检查在生成输入的过程中是否有误或者尝试将该张量中的非法字符去除。以下是一个可能的代码实现：

input_ids = accelerator.unwrap_model(model).generate(**batch['context'], max_new_tokens=args.max_gen_len, no_repeat_ngram_size=3) # 去除非法字符 input_ids[input_ids=='o'] = 0

针对第二个问题，可以进行如下解答：在T5模型中，gen_seqs函数会返回解码之后得到的输出，而greedy_search函数需要将这个输出作为输入进一步处理。但是由于第一个问题中出现了非法字符，可能会导致gen_seqs函数返回的解码结果中出现None值，从而影响后续的计算。例如，在greedy_search函数中，如果输入的是None值，那么函数会执行失败并报错。因此建议先解决第一个问题中的非法字符问题，然后再尝试在greedy_search函数中使用新的input_ids。以下是一个可能的代码实现：

input_ids = accelerator.unwrap_model(model).generate(**batch['context'], max_new_tokens=args.max_gen_len, no_repeat_ngram_size=3) # 去除非法字符 input_ids[input_ids=='o'] = 0 # 在解决了第一个问题之后，使用新的input_ids再次调用greedy_search output_ids = greedy_search(input_ids, model, args.max_gen_len)

以上就是建议的格式化回答。需要注意的是，这只是一个样例回答，具体回答应该根据实际情况进行调整。此外，代码示例中的变量名称和函数调用都是假设的，具体使用细节还需要根据实际代码进行修改。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

IDEA中Generate异常 java
2022-04-19 18:24

回答 1 已采纳你到大括号里面去Generate，不要到外面。。。
GoLang中HouseRobber编程任务中的错误
2017-07-20 17:52

回答 1 已采纳 It seems you hit a subtle issue with the append function. You should not be using append to creat
Qt的generate form有什么用？ qt windows 开发语言
2022-09-20 14:38

回答 2 已采纳勾了就会创建.ui文件而且生成的代码里会自动添加ui成员变量，如果你要用designer设置ui就勾，如果没有界面或者要自己在cpp里添加界面代码就不要勾
Transformer自然语言处理实战pdf阅读
2024-07-23 18:01

fc&&fl的博客在以上示例代码中，我们还展示了如何通过model参数指定模型来替换默认模型，从而可以为你的应用程序选择最佳模型，你可以在Hugging Face Hub上找到数千种语言对模型。接下来我们看看最后一个应用，然后再开始...
如何使用godoc为文件夹中的所有软件包生成HTML文档
2018-03-18 19:55

回答 1 已采纳 You have two questions here: Is it possible to generate HTML pages for all packages linked tog
在Go中调用PFXExportCertStoreEx不会返回数据
2016-02-25 17:22

回答 2 已采纳 This is the expected behavior. According to this: https://msdn.microsoft.com/en-us/library/window
如何解决golang中“调用日期时缺少位置”的错误[关闭]
2018-10-31 06:23

回答 1 已采纳 It should be America/Phoenix, not America/Pheonix. timeZone, _ := time.LoadLocation("America/Phoe
Huggingface Transformers库学习笔记（二）：使用Transformers(上)（Using Transformers Part 1）
2021-04-06 14:42

Q同学的nlp笔记的博客使用Transformers（Using Transformers）使用Transformers（Using Transformers）任务汇总（Summary of the tasks）序列分类（Sequence Classification）提取式问答（Extractive Question Answering）语言模型...
使用命令行mvn archetype:generate构建maven项目时报错 java 开发语言有问必答
2021-12-16 02:48

回答 2 已采纳有没有试过指定运行插件的版本呢？比如 mvn org.apache.maven.plugins:maven-archetype-plugin:2.4:generate\ -Darchetyp
用标记换行“ go：generate”行吗？
2018-03-25 18:28

回答 1 已采纳 The Go Programming Language Specification Comments Comments serve as program document
Java 非主函数调用其他类的方法，对象报错为null java
2023-04-06 23:45

回答 2 已采纳题主的意思是player是null?把main方法里面的Player player = new Player（）删除，然后把第二行的public Player player改成private stat
在亚马逊云科技AWS上利用PEFT和RLHF高效微调AI大模型减少有害回复
2024-08-05 23:57

佛州小李哥的博客本次我将介绍如何用亚马逊云科技的AI模型训练服务Amazon SageMaker和PEFT、RLHF框架高效微调AI大模型FLAN-T5-BASE，减少大模型回复过程中的潜在有害内容。我将带领大家手把手通过一行一行的代码学会AI模型的微调，0...
使用go：generate引用当前文件
2017-06-20 00:40

回答 1 已采纳 You can refer current file as follows: //go:generate sometool $GOFILE $GOFILE get expanded to b
【AI大模型专栏学习笔记01 基础知识】大火的AI大模型究竟是什么？原来这么容易上手！
2024-03-14 10:59

北顾.岛城的博客 pip install openai %env OPENAI_API_KEY=[申请的API Key] 1.3 快速代码示例（1）例子1:生成商品信息下面代码调用了OpenAI的Completion接口为一个在1688上找到的中文商品名称做三件事情：为这个商品写一个适合在...
【完结】cyのMemo（20240820~20240915）
2024-08-20 23:42

囚生CY的博客 ') while True: #每个循环模拟发送一个任务给消费者模型 data = (yield ) print('收到任务：', data) def producer(): #方法producer()代表消费者模型 c = xie() #调用函数xie() c.send(None) for i in range(3): ...
大模型资料总结
2024-02-26 20:21

ydp15755423176的博客 now(model='gpt-3.5-turbo-instruct',mode='balance'): """ 基于Completion.create函数的多轮对话机器人 :param model: 调用的大语言模型，默认为text-davinci-003 :param mode: 聊天机器人预设模式，默认为平衡模式...
【Transformers】第 7 章：问答
2022-11-10 08:28

Sonhhxg_柒的博客无论您是研究人员、分析师还是数据科学家，在某些时候，您都可能需要在海量文档中跋涉才能找到您正在寻找的信息。更糟糕的是，Google 和 Bing 不断提醒您存在更好的搜索方式！例如，如果我们搜索“居里夫人什么时候...
Transformers 4.37 中文文档（十五）
2024-06-23 12:01

绝不原创的飞龙的博客 =None 通过将assistant_model传递给.generate()来进行辅助解码调用assisted_decoding()。您不需要直接调用上述任何方法。将自定义参数值传递给‘.generate()‘。要了解更多关于解码策略的信息，请参考文本生成策略...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月6日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

T5调用generate中得到的logit为None

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新