CNN/DM 数据集中多个摘要是干什么用的?
下面图片是该数据集经过分词处理之后的一个例子。数据来源于开源仓库https://github.com/yixinL7/BRIO
我的疑问
网上其他博主说明CNN/DM数据集中每一篇文章有多个摘要,也就是我图片中abstract的内容。那么请问,是否需要模型在生成摘要时一次性生成多个摘要的内容(图片中的5句话)?另外在计算的评价指标的时候,是否是多个摘要的内容一起计算呢?
换句话说,图片中的5句话应该看成一个整体的标签?还是看成独立的标签,即每一句话拿出来可以当作一个正确答案?