文本摘要任务泄露问题

问题：模型在1个epoch时几乎达到收敛

PS：我想进行一个简单的文本摘要生成任务，数据集为哈工大的新闻数据集，我想利用Transformer的解码器来完成该任务。
我尝试了两种方法，两种方法都将 title 的 embedding + position encode作为label输入：

1、直接将content文本映射为标签后，通过广播机制或者卷积变为[B, L, D]的形式，之后视为编码器的输出传入解码器中；
2、使用conformer编码器，将文本进行编码后变为[B, L, D]的形式，之后输入解码器中；

但是两种方法都会出现上述的快速收敛问题，我排查了是否存在标签泄露的问题，同时也尝试了另一种线性编码器，应该不是标签泄露。

下面是我的代码部分，有没有解答能够看出问题在哪？或者给出思路；

代码：

链接:https://pan.baidu.com/s/1vTBCDcjwRaRXef5eSjYuwA
提取码:94f6

AI生成的答案别来，我要的是分析我现在的代码，我自己都会用chatgpt

压缩包密码：YQL199831，忘了有没有！，或者yql199831

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

25条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星光菌子 2024-07-05 14:44
关注
绷不住了，现在全是ai，解决不了任何问题不说，占用回答区，恶心得很

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于强化学习转文本的问题人工智能深度学习
2023-01-10 16:43

回答 1 已采纳一种方法是使用规则-基本的方法，您可以将状态-动作序列中的每个状态和动作映射到特定的文本语句。这种方法虽然简单，但它只适用于非常简单的状态-动作序列，并且需要大量的人工编写规则。另一种方法是使用深度
富文本解析视频不同手机显示效果问题 css javascript 前端框架
2023-02-04 10:43

回答 2 已采纳该回答引用ChatGPT请参考下面的解决方案，如果可行还请点击采纳，感谢！尝试以下几种方法： 1、对于不同牌子的手机使用不同的视频格式，例如支持 .mp4 和 .webm 格式的视频。 2、使用vi
爬取网页数据列表无法索引文本问题 python 爬虫
2018-12-11 12:34

回答 2 已采纳 ```python for item in results: print(item.text) ```
自然语言处理中的文本摘要：技术和应用
2023-12-31 01:34

AI天才研究院的博客自然语言处理(NLP)是人工智能的一个重要分支，其中文本摘要是一种常见的NLP任务。文本摘要是指从长篇文章中提取关键信息，生成简洁的摘要。这种技术在新闻报道、研究论文、网络文章等方面具有广泛的应用。在过去的...
c语言文本输出乱码问题 c语言
2022-06-13 02:38

回答 4 已采纳输出的TXT文件编码的默认格式格式与c语言的默认格式不一致，导致乱码，用记事本打开时可以换一种编码方式即可
静态文本控件调用函数问题 c++ mfc
2023-02-10 19:36

回答 2 已采纳在Dlg.cpp文件中直接添加m_Static.SetWindowText("使用函数显示静态文本控件的显示文本");是在全局作用域中执行的，但m_Static变量是在类作用域内定义的，所以在全局作用
python tkinter 隐藏按钮/文本问题 python
2023-01-13 15:47

回答 1 已采纳可以使用pack_forget()或grid_forget()来隐藏按钮或文本。如果你使用的是pack()方法来管理布局，则可以使用pack_forget()来隐藏按钮或文本，如果你使用的是grid(
AI语言模型在文本生成和摘要方面的应用
2024-04-27 16:20

AI天才研究院的博客 AI语言模型在文本生成和摘要方面的应用 1. 背景介绍 1.1 自然语言处理的重要性在当今信息时代,自然语言处理(Natural Language Processing, NLP)已成为人工智能领域中最重要和最具挑战性的研究方
关于wangeditor富文本插入网络图片问题前端
2021-11-24 11:54

回答 2 已采纳原因是得有一个return
python写入文本的问题 python
2022-09-10 08:35

回答 2 已采纳可能是变量id的问题。把线程相关代码附出来看看
visual studio 文本编辑器下方任务栏如何 ide visual studio
2022-11-24 08:55

回答 10 已采纳
文本摘要：Transformer如何提炼关键信息
2024-05-02 01:08

AI天才研究院的博客文本摘要：Transformer如何提炼关键信息 1. 背景介绍 1.1 文本摘要的重要性在当今信息时代,我们每天都会接收到大量的文本数据,包括新闻报道、社交媒体帖子、电子邮件等。然而,有效地从这些海量信息中提取关键内容
不同手机富文本解析视频标签问题 css javascript 前端
2023-02-04 13:17

回答 1 已采纳回答不易，求求您采纳点赞哦建议您尝试使用video标签作为富文本解析视频标签，这是一种通用的解决方案。如果video标签也不能满足您的需求，您可以尝试使用第三方的视频播放组件，例如video.j
文本摘要与抽取：信息的精简与提取
2023-12-27 17:58

AI天才研究院的博客文本摘要与抽取是自然语言处理领域中的一个重要研究方向，其主要目标是将长篇文本转换为更短的摘要，或者从文本中提取关键信息。这种技术在新闻报道、文献检索、文本分类等方面具有广泛的应用。随着大数据时代的到来...
语言模型在文本摘要与生成领域的应用
2024-01-07 02:04

AI天才研究院的博客在文本摘要和文本生成方面，语言模型发挥了重要的作用。本文将从以下几个方面进行阐述：背景介绍核心概念与联系核心算法原理和具体操作步骤以及数学模型公式详细讲解具体代码实例和详细解释说明未来发展趋势...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月5日

悬赏问题

¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥15 各位帮我看看如何写代码，打出来的图形要和如下图呈现的一样，急
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error
¥15 VS2022+WDK驱动开发环境
¥30 关于#java#的问题，请各位专家解答！
¥30 vue+element根据数据循环生成多个table，如何实现最后一列平均分合并
¥20 pcf8563时钟芯片不启振
¥20 pip2.40更新pip2.43时报错
¥15 换yum源但仍然用不了httpd