BERT模型代码问题！！

如图所示为CSDN一个帖子的BERT模型的截取，在这个方法定义之前已经有全局变量batch_size＝6和maxlen＝30。这个seq_q的实例化就是用PAD补齐之后的6*30的tensor，所以还要取出来seq_q的size然后赋值给数值一模一样局部变量，为什么不能写成图二这种写法？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-07-19 15:57
关注
引自免费微信小程序：皆我百晓生

在您提供的两段代码中，主要问题在于函数的参数定义以及函数中如何使用这些参数。在图一中，seq_q和seq_k都是输入函数的参数，并在函数内部直接使用这些参数进行大小计算。但是在图二中，这部分被删除了或者没有正确地复制过来。这是问题的关键所在。

首先，我们需要理解为什么在函数内部获取张量的尺寸是必要的。这是因为当我们使用PyTorch框架时，张量的尺寸可能会随着输入数据的不同而变化。因此，我们不能假设seq_q和seq_k的尺寸是固定的。即使我们知道全局变量batch_size和maxlen的值，也不能直接用于函数内部的计算，因为函数的输入参数（如seq_q和seq_k）可能会传递不同的值给函数。因此，我们需要在函数内部获取张量的尺寸以确保代码的正确性和通用性。这也是为什么在图一中要计算seq_q.size()和赋值给局部变量而不是直接使用全局变量的原因。此外，这种方法使得函数对输入数据的大小不敏感，只关心特定的维度即可，这样的代码设计更符合PyTorch的操作习惯和面向对象的编程原则。在处理更复杂的模型和更多种类的输入数据时尤其重要。如果您知道所有输入张量的维度始终一致并总是固定的话，可以只定义一个参数在函数内部直接使用。然而，对于一般的深度学习模型来说，这种做法并不常见且可能导致潜在的问题。至于为什么在图二中不能写成您所展示的那样，是因为缺少了必要的参数获取和计算步骤。因此，正确的做法应该是像图一那样在函数内部获取张量的尺寸并进行相应的操作。如果您想简化代码并直接使用全局变量（尽管这并不是一种好的做法），您应该确保所有的函数都知道全局变量的存在并且能够正确地使用它们。但通常推荐的做法还是在函数内部直接处理需要的尺寸和数据维度等，以便让代码更具有通用性和可读性。在提供的代码片段中并没有显示对seq_k的使用情况，所以具体如何处理取决于这个参数在你的BERT模型中的用途。总的来说，为了代码的健壮性和灵活性，通常推荐在函数内部获取和操作张量的尺寸和维度等信息。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

跑一个bert模型出了点问题？ pycharm tensorflow 自然语言处理
2022-09-28 13:12

回答 1 已采纳建议你看下这篇博客👉 ：bert模型训练时的一些问题及解决方法
使用kashgari实现BERT+Bilstm命名实体识别，在保存模型时报错！！！求助！！！ python tensorflow 神经网络自然语言处理
2021-03-01 19:29

回答 5 已采纳你好。这个错误需要进入源码进行一下修正。我已经私信你了，请看一下。需要在D:\dev\anaconda\lib\site-packages\kashgari\tasks\abs_task_mode
bert模型请求帮助 bert python 深度学习
2023-03-08 11:19

回答 2 已采纳 “Devil组”引证GPT后的撰写：这个错误提示意味着在运行Google官方的BERT模型时必须指定"max_steps"参数的值大于0。"max_steps"是指训练模型的最大步数，也就是最大训练
bert模型的Python实现
2019-04-15 17:13

标题 "BERT模型的Python实现" 涉及到的是自然语言处理领域中一个非常重要的模型——BERT（Bidirectional Encoder Representations from Transformers），以及如何用Python编程语言来实现它。BERT是一种预训练语言...
机器学习bert模型pytorch bert pytorch 机器学习
2023-03-09 18:17

回答 1 已采纳文章：pytorch 使用bert的中间某几层隐藏层的结果以及使用pytorch_pretrained_bert 的问题以及解决方法中也许有你想要的答案，请看下吧您还可以看一下唐宇迪老师的深度学习
你好你好，我最近在尝试用bert模型进行情感分析三分类，看了你的博客受益匪浅，但是遇到了一些问题 bert python
2022-05-22 19:36

回答 1 已采纳这种差不多有两种情况，一个是设置参数过大导致GPU内存不足一开始就无法承载模型，这时可以把输入数据长度或者训练批次逐步调小进行实验；二是GPU其实可以承载模型，参数也没问题，但是可能由于多次运行程序或
bert模型训练时sklearn.__check_build._check_build问题 bert python sklearn
2023-04-06 17:58

回答 3 已采纳试试以下命令 pip uninstall sklearn pip install numpy scipy pip install scikit-learn
NLP专栏｜图解 BERT 预训练模型！
2020-11-01 19:59

Datawhale的博客 BERT模型打破了基于语言处理的任务的几个记录。在 BERT 的论文发布后不久，这个团队还公开了模型的代码，并提供了模型的下载版本，这些模型已经在大规模数据集上进行了预训练。这是一个重大的发展，因为它使得任何一...
BERT问题，无法解决，求帮助？ bert python tensorflow
2021-07-21 10:53

回答 1 已采纳你要打印这个line的值看看，是不是有两个元素能取到[1] 这个索引
Bert二分类结果分析 bert 分类自然语言处理
2023-03-27 22:47

回答 3 已采纳该回答引用自ChatGPT 有几个可能的原因可以导致risk类别的预测f1-score始终为0：数据不平衡问题：尽管您使用了Focal Loss来改善数据不平衡问题，但如果risk类别的训练数据量非
bert二分类返回值是否可以输出 bert 深度学习自然语言处理
2023-04-13 10:40

回答 1 已采纳是的，对BERT模型进行微调后，可以输出二分类的结果，通常为0和1。在进行相似度分析时，BERT模型可以将两个输入文本编码为向量，然后计算这两个向量之间的相似度得分，将相似度得分输入到一个二元分类器中
【NLP】图解 BERT 预训练模型！
2020-11-05 09:00

风度78的博客 BERT模型打破了基于语言处理的任务的几个记录。在 BERT 的论文发布后不久，这个团队还公开了模型的代码，并提供了模型的下载版本，这些模型已经在大规模数据集上进行了预训练。这是一个重大的发展，因为它使得任何一...
一个中文长句子，使用Bret模型可以训练出来添加多个独立的标签吗？ bert 自然语言处理语言模型
2023-04-13 13:46

回答 2 已采纳 Bert模型可以用于训练多标签分类问题，也就是将一个文本样本分为多个标签类别。但是，对于一个中文长句子有多个含义的情况，需要先对句子进行分词，将其转换为一系列的词汇，然后针对每个词汇训练一个标签分类器
基于pytorch的中文语言模型预训练模型源码
2022-03-23 12:49

Python作为编程语言，是实现这些模型的常用工具。人工智能和深度学习则是这个领域的背景，它们共同构成了这个项目的技术栈。总之，这个项目提供了一个宝贵的资源，让你能够深入学习和实践基于PyTorch的中文语言...
【NLP专栏】图解 BERT 预训练模型！
2020-11-03 12:06

zenRRan的博客 BERT模型打破了基于语言处理的任务的几个记录。在 BERT 的论文发布后不久，这个团队还公开了模型的代码，并提供了模型的下载版本，这些模型已经在大规模数据集上进行了预训练。这是一个重大的发展，因为它使得任何一...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月19日

悬赏问题

¥15 如何能达到用ping0.cc检测成这样？如图
¥15 关于#DMA固件#的问题，请各位专家解答！
¥15 matlab生成的x1图不趋于稳定，之后的图像是稳定的水平线
¥15 请问华为OD岗位的内部职业发展通道都有哪些，以及各个级别晋升的要求
¥20 微信小程序 canvas 问题
¥15 系统 24h2 专业工作站版，浏览文件夹的图库，视频，图片之类的怎样删除？
¥15 怎么把512还原为520格式
¥15 MATLAB的动态模态分解出现错误，以CFX非定常模拟结果为快照
¥15 求高通平台Softsim调试经验
¥15 canal如何实现将mysql多张表(月表)采集入库到目标表中(一张表)？

BERT模型代码问题！！

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新