Pytorch调用bertEncoderbaTypeError: forward() missing 1 required positional argument: 'attention_mask'

问题与背景

在调用pytorch库的bert encoder报错，报错内容：

TypeError: forward() missing 1 required positional argument: 'attention_mask'

我的解答思路和尝试过的方法

# 替换self.encoder = self.bert.model.encoder(config)
# 方案1
self.encoder = self.bert.model.encoder()
# 方案2
self.encoder = self.bert.model.encoder
# 方案3
self.encoder = self.bert.model.encoder(config)
# 方案3指定固定参数
self.encoder = self.bert.model.encoder(768, [0,1])

思考

bert在实例化self.bert=Bert()时，bert对象已经包含了bert_embedding和bert_encoder等结构。

请问此时能否说明模型的编码器已经使用了bert编码器？
请问是否需要单独指定模型的编码器self.encoder = self.bert.model.encoder()？

模型结构更直观一些


模型：bert_embedding+transformer_encoder+transformer_decoder
结构：
self{
    bert{
        embedding()
        encoder()
        decoder()
    }
    (encoder)transformer_encoder{}
    (decoder)transformer_decoder{}
}

模型：bert_embedding+bert_encoder+transformer_decoder
结构：
self{
    bert{
        embedding()
        encoder()  # flag1
        decoder()
    }
    (encoder)bert_encoder{} # flag2 # 这里是否需要单独指定bert_encoder尚不确定，可能会和flag1位置指向同一个地址产生递归
    (decoder)transformer_decoder{}
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
九筒- 2022-07-22 21:41
关注
已解决，根本原因是数据格式的问题，在使用bert_encoder之前，需要将数据格式转换为BertData()格式

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Pytorch调用bertEncoderbaTypeError: forward() missing 1 required positional argument: 'attention_mask' bert pytorch 深度学习
2022-07-07 15:35

回答 2 已采纳已解决，根本原因是数据格式的问题，在使用bert_encoder之前，需要将数据格式转换为BertData()格式
pytorch出现TypeError: 'module' object is not callable python pytorch 神经网络
2021-09-02 08:56

回答 1 已采纳 CUB_loader 是什么怎么定义的，可能是传参问题
TypeError: __init__() got an unexpected keyword argument 'num_worker' python pytorch 深度学习
2022-07-16 19:42

回答 3 已采纳是我前面抄错了，把num_worker改为num_workers之后就可以了，但还是不清楚为什么😣
解决使用bert encoder出现的一系列问题
2022-07-22 23:53

九筒-的博客任务详情输入：一串文本数据输入格式：二进制.pt文件模型：bert，Transformer 输出：一串文本数据问题起因模型在加载数据时报错，报错内容如下 TypeError: forward() missing 1 required positional argument:...
YOLOv5(PyTorch)实战：训练自己的数据集课程中遇到的问题 pytorch
2022-04-05 21:57

回答 1 已采纳 in "models/yolov5s_ball.yaml", line 5, column 1检查以下这个文件，这里出现的错误
TypeError: __init__() takes 2 positional arguments but 3 were given请问应该如何修改 python
2022-04-21 11:11

回答 2 已采纳 model=OneVsRestClassifier(svr_rbf,n_jobs=-1)
【提问-pytorch运行报错】CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)` pytorch
2021-08-20 11:18

回答 1 已采纳 label是类别，比如说（“100，“110”,“111“），你的100是第0类，110是第1类，111是第2类，你这么写变成了100是第100类，110是第110类，111是第111类了，原本你只有
如何利用PyTorch写一个Transformer实现英德互译
2022-05-02 20:09

_Old_Summer的博客 Transformer模型出处：2017 《Attention is all you need》 Transformer中的位置编码是什么意思？ https://kazemnejad.com/blog/transformer_architecture_positional_encoding/kazemnejad.com 运行以下代码请...
pytorch报错RuntimeError: v1.summary.FileWriter is not compatible with eager execution python pytorch 神经网络
2021-09-01 08:55

回答 1 已采纳这是torch还是tensorflow的信息太少了
pytorch RuntimeError: already started 机器学习深度学习神经网络
2019-03-30 15:28

回答 4 已采纳问题解决，应该是visual studio code的问题，换一个IDE就ok
TypeError: float() argument must be a string or a number, not '_NoValueType' python pytorch 人工智能
2021-08-04 08:55

回答 1 已采纳 float() argument must be a string or a number报错的意思float(A)，要求A是一个字符串数字或者数字，但是你的是空的，你在哪里用float转换数值的地方
LLMs：《Optimizing your LLM in production在生产环境中优化您的LLM》翻译与解读—LLM在实际应用中面临的两大挑战(内存需求+对更长上下文输入需求)+提升LLM部署
2023-09-19 01:15

一个处女座的程序猿的博客《Optimizing your LLM in production在生产环境中优化您的LLM》翻译与解读—LLM在实际应用中面临的两大挑战(内存需求+对更长上下文输入需求)+...高效的自注意力算法Flash Attention+优化模型结构【位置嵌入/键...
pytorch1.7 RuntimeError: Expected grad_output->is_contiguous(grad_output->suggest_memory_format()) pytorch
2021-09-06 16:25

回答 1 已采纳这个应该是你哪里有经过切片操作或者交换维度导致的，类似torch.view()之后没有操作就会报这个错误。报错的意思就是你前面的操作之后导致tensor矩阵无法连续了，你需要在切片完成之后后面加上X.
Transformers 源码解析（十七）
2024-07-02 12:07

绝不原创的飞龙的博客 from .pytorch_utils import ( # 从当前目录的 pytorch_utils 模块导入若干函数和类，忽略 F401 错误 Conv1D, apply_chunking_to_forward, find_pruneable_heads_and_indices, id_tensor_storage, is_torch_greater_...
Transformers 源码解析（一百九十二）
2024-07-03 11:35

绝不原创的飞龙的博客 # 如果任务为多选题，则定义动态轴的维度 dynamic_axis = {0: "batch", 1: "choice", 2: "sequence"} else: # 否则定义动态轴的维度 dynamic_axis = {0: "batch", 1: "sequence"} # 返回有序字典，包含输入名称和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月7日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

Pytorch调用bertEncoderbaTypeError: forward() missing 1 required positional argument: 'attention_mask'

问题与背景

相关代码

我的解答思路和尝试过的方法

思考

模型结构更直观一些

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新