在 xbert 提供的代码中，为什么 BertLMHeadModel.generate() 方法得到的结果全是相同的？

在 xbert 提供的代码中，有一个 BertLMHeadModel 类，我将其作为模型的 text_decoder，希望它能通过 generate() 方法，根据 text_encoder 中得到 encoder_hidden_states 和 encoder_attention_mask 来解码出对应的 text token，输入参数具体如图所示，但是为什么 outputs 输出的每一项都相同？而且在我去除 **model_kwargs 参数的情况下，模型仍能跑出一样的结果（但是在别的模型中，这一参数是必须的）？其中 self.text_decoder 就是 BertLMHeadModel。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CodeBytes 2023-02-21 22:23
关注
该回答引用ChatGPT

输出每一项相同可能是因为在使用 generate() 方法时，没有指定需要生成的文本长度，因此生成的文本长度可能是固定的，或者在默认的情况下，输出长度可能是相同的。你可以在使用 generate() 方法时传递 max_length 和 min_length 参数来指定生成的文本长度的范围，从而得到不同的输出。

至于 model_kwargs 参数，它可以用来传递模型中的其他参数，例如 encoder_hidden_states 和 encoder_attention_mask 等，以便在模型中使用。如果你的模型不需要这些参数，那么你可以忽略这个参数，模型仍然可以正常运行。在你的模型中，如果你没有使用这些参数，那么你可以尝试在调用 generate() 方法时不传递这个参数，以避免混淆。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

XBert Extension-crx插件
2021-04-03 03:54

数据科学和机器学习的最新进展可自动检测会计数据中的模式，异常和错误，为您节省时间和金钱，并提供更智能的实时见解。XBert是一个独特且易于使用的Xero云会计附加程序，它每小时对您的会计数据进行分析。XBert帮助...
论文阅读【16】APLC_XLNET:Pretrained Generalized Autoregressive Model with Adaptive........
2023-04-13 11:06

Alan and fish的博客极端多标签文本分类（XMTC）是一项任务，它是...我们在5个基准数据集上进行的实验表明，我们的方法在4个基准数据集上取得了新的最先进的结果。在这篇论文中，我门提出了一种深度学习的方法解决极端多标签文本分类问题。
在VC++6.0中，如何将多个工程添加到同一个工作区？
2019-10-01 20:23

ChrisChao1992的博客方法一：Project->Insert Project into Workspace-&gt...方法二：在工作区Workspace中project上右键->Insert Project into Workspace->添加的工程。转载于:https://www.cnblogs.com/Xbert/p/5669175.html...
在CodeBlocks中出现：undefined reference to `xxxxxx@x‘ 的解决方案
2020-12-21 15:33

Founless的博客在CodeBlocks中出现：undefined reference to `xxxxxx@x’ 的解决方案 socket编程时，使用codeblocks需要加载libws2_32.a 使用CodeBlocks在编译程序的时候出现如下错误： undefined reference to inet_addr@4' ...
云计算实战应用案例精讲-【深度学习】多模态融合（最终篇）
2023-04-19 00:30

林聪木的博客对每一种信息的来源或者形式，都可以称为一种模态（Modality），目前研究领域中主要是对图像，文本，语音三种模态的处理。之所以要对模态进行融合，是因为不同模态的表现方式不一样，看待事物的角度也会不一样，所以...
socket编程时，使用codeblocks需要加载libws2_32.a
2019-10-01 20:23

ChrisChao1992的博客步骤如下图：一、二、 libws2_32.a下载地址：http://files.cnblogs.com/files/Xbert/libws2_32.rar 转载于:https://www.cnblogs.com/Xbert/p/5466963.html
前沿重器[7] | 小布助手登顶百度千言短文本相似度的秘诀
2021-02-14 21:51

机智的叉烧的博客业务应用在现实应用中，往往需要考虑到更多问题，智能问答的基本结构和我之前提的很多场景类似——“召回+排序”，这个思路的讨论我专门整了一篇文章来总结，此处看看小布助手闲聊这块的处理逻辑：表征和召回 ...
X-BERT eXtreme Multi-label Text Classification with BERT
2020-02-29 10:24

Forlogen的博客文本分类（text classifition）可以简单的分为二分类问题和多分类问题，现在的文本分类相挂钩的任务往往解决的都是前者，而当类别数较少时，多分类问题仍然可使用one-vs-all的方法将多分类问题转换为二分类问题处理...
机试-括号匹配
2019-10-01 20:24

ChrisChao1992的博客 1 #include 2 #include 3 #include <stdio.h> 4 5 using namespace std; 6 7 stack< int > S; 8 char ...转载于:https://www.cnblogs.com/Xbert/p/5109980.html
基于深度学习的短文本相似度学习与行业测评
2021-07-08 18:37

OPPO小布助手的博客文本相似度计算作为NLP的热点研究方向之一，在搜索推荐、智能客服、闲聊等领域得到的广泛的应用。在不同的应用领域，也存在着一定的差异，例如在搜索领域大多是计算query与document的相似度；而在智能客服、聊天领域...
C语言-五子棋
2016-01-14 15:10

weixin_33937778的博客 1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <windows.h> 4 5 #define N 19 6 int pieces[N][N]= {0}; //五子棋盘19*19 7 int flag=1; //状态，0-无子；... 8...
IC技术圈期刊 2021年第5期
2021-07-13 17:10

FPGA技术江湖的博客 IC技术圈期刊内容涵盖FPGA、前端... 直接扩频通信（下）仿真基于 FPGA 的 UART 控制器设计（VHDL）（下）为什么FPGA主频比CPU慢，却可以帮其加速？什么是FPGA工程师的核心竞争力 Xilinx FPGA 编程技巧之常用时序约束
数据结构-顺序表
2019-10-01 20:23

ChrisChao1992的博客顺序表中没有元素！ " endl; 62 else 63 { 64 for ( int i= 1 ;i<=L.length;++ i) 65 cout " " " " ; 66 } 67 return ; 68 } 69 70 /* 71 int LocateElem(Sqlist...
进程同步和通信 -生产者和消费者问题模拟
2019-10-01 20:23

ChrisChao1992的博客 pipe[8]已经填满，把产品存储在生产者队列中 pipe_produce[i_prodece]= out ; i_prodece ++ ; sum ++ ; return 0 ; } pipe[tb ->writeptr][ 0 ]= out ; // out为产品标识 pipe[tb->writeptr][ 1 ]= 1 ;...
回溯法之应用
2019-10-01 20:23

ChrisChao1992的博客适用范围很广，但其算法的时间效率通常很低，因此它常常作为一种启发思路的策略，面对新问题未发现其内在规律时可以首先考虑用回溯法思想全盘的分析，以便逐步发现更好的解决方法。　回溯法的应用之一是N皇后问题...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 2月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月21日

悬赏问题

¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等
¥15 matlab 用yalmip搭建模型，cplex求解，线性化处理的方法
¥15 qt6.6.3 基于百度云的语音识别不会改
¥15 关于#目标检测#的问题：大概就是类似后台自动检测某下架商品的库存，在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
¥15 神经网络怎么把隐含层变量融合到损失函数中？
¥15 lingo18勾选global solver求解使用的算法
¥15 全部备份安卓app数据包括密码，可以复制到另一手机上运行
¥20 测距传感器数据手册i2c
¥15 RPA正常跑，cmd输入cookies跑不出来

在 xbert 提供的代码中，为什么 BertLMHeadModel.generate() 方法得到的结果全是相同的？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新