有人把GHM loss用在NLP领域里过吗

class GHM_Loss(nn.Module):
    def __init__(self, bins, alpha):
        super(GHM_Loss, self).__init__()
        self._bins = bins
        self._alpha = alpha
        self._last_bin_count = None

    def _g2bin(self, g):
        return torch.floor(g * (self._bins - 0.0001)).long()

    def _custom_loss(self, x, target, weight):
        raise NotImplementedError

    def _custom_loss_grad(self, x, target):
        raise NotImplementedError

    def forward(self, x, target):
        g = torch.abs(self._custom_loss_grad(x, target))
        bin_idx = self._g2bin(g)
        bin_count = torch.zeros((self._bins))
        for i in range(self._bins):
            bin_count[i] = (bin_idx == i).sum().item()

        N = x.size(0)

        nonempty_bins = (bin_count > 0).sum().item()
        gd = bin_count * nonempty_bins
        gd = torch.clamp(gd, min=0.0001)
        beta = N / gd
        return self._custom_loss(x, target, beta[bin_idx[:self._bins]])


class GHMC_Loss(GHM_Loss):
    def __init__(self, bins, alpha):
        super(GHMC_Loss, self).__init__(bins, alpha)

    def _custom_loss(self, x, target, weight):
        return torch.sum(
            (torch.nn.NLLLoss(reduce=False)(torch.log(x), target)).mul(weight.to('cpu').detach())) / torch.sum(
            weight.to('cpu').detach())

    def _custom_loss_grad(self, x, target):
        x = x.cpu().detach()
        target = target.cpu()
        return torch.tensor([x[i, target[i]] for i in range(target.shape[0])]) - target

这段GHM loss的代码我想把他用在NLP来解决样本不平衡问题。之前用focal loss的代码能直接套进去，但这个套进去发现各自bug运行不起来，有大佬知道该怎么改吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
heart_6662 2022-12-25 23:34
关注
GHM loss (Gradient Harmonized Single-stage Detector loss)是一种常用的目标检测损失函数，它能够很好地平衡类别不平衡的情况下的训练效果。它是在单阶段目标检测模型中使用的。

GHM loss 是一种图像分割和目标检测领域的损失函数，我觉得并不适用于 NLP (Natural Language Processing, 自然语言处理) 领域。 NLP 领域常用的损失函数有交叉熵损失、平均绝对误差损失、平均平方误差损失等

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

以编码形式获取卷曲响应 php
2014-10-09 05:54

回答 2 已采纳 You will get same output as in your shell script with something like that : $headers = array(
NLP类别不均衡问题之loss大集合
2022-03-22 12:10

PaperWeekly的博客 ©作者 |眼睛里进砖头了单位|东华大学研究方向 |自然语言处理NLP 任务中，数据类别不均衡问题应该是一个极常见又头疼的的问题了。最近在工作中也是碰到这个问题，花了些时间梳理并实践了下类别不均衡问题的解决方式...
NLP样本不均衡之常用损失函数对比（附代码）
2020-10-06 23:25

zenRRan的博客本文分为三个部分，第一个部分主要介绍一下在分类问题中为什么用交叉熵作为损失函数，第二部分主要介绍一下在交叉熵的基础上的一些改进的损失函数，最后使用上述的几种损失函数在 CLUENER 细...
AAAI 2019 Oral | 把Cross Entropy梯度分布拉‘平’，就能轻松超越Focal Loss
2019-01-16 12:17

PaperWeekly的博客单阶段物体检测（One-stage Object Detection）方法在模型训练过程中始终面临着样本分布严重不均衡的问题，来自香港中文大学的研究者们在论文 Gradi...
文本分类在内容安全应用中的数据不平衡问题
2020-10-19 14:05

网易易盾的博客经过几十年的发展，文本分类在学术界已经是一个比较成熟的技术，目前自然语言处理（NLP）的研究热点已经不在文本分类上面。然而，作为内容安全检测的一个重要技术手段，文本分类在实际业务中还是有不少的挑战。 ...
【NLP】打破BERT天花板：11种花式炼丹术刷爆NLP分类SOTA！
2020-08-17 11:00

风度78的博客文 |JayLou娄杰编 |小轶在2020这个时间节点，对于NLP分类任务，我们的关注重点早已不再是如何构造模型、拘泥于分类模型长什么样子了。如同CV领域当前的重点一样，我们更应该关...
打破BERT天花板：11种花式炼丹术刷爆NLP分类SOTA！
2020-08-13 22:20

夕小瑶的博客星标/置顶小屋，带你解锁最萌最前沿的NLP、搜索与推荐技术文 |JayLou娄杰编 |小轶在2020这个时间节点，对于NLP分类任务，我们的关注重点早已不再是如何构造模型、拘泥于分类...
大模型八股文
2023-11-13 20:00

榴莲_的博客 Generate with Citation（生成时引用，用户自己可以通过提供的参考快速判断回答对不对），**Factual Consistency Evaluation（**事实一致性评估）属于自然语言推理任务Natural Language Inference(NLI)的一种。...
目标检测の共性问题总结
2023-11-07 16:05

whaosoft143的博客在进行回归操作的时候，预测框和gt的IoU同回归后预测框和gt的IOU相比，一般会有较大的变化，但是NMS使用的时候用的是回归前的置信度，这样就会导致一些回归后高IoU的预测框被删除。所以，不一样样本的选择是相互竞争...
港中文-商汤OpenMMLab开源全景图！
2020-07-14 23:15

OpenCV中文网公众号的博客 OpenMMLab 为香港中文大学-商汤科技联合实验室MMLab开源的算法平台，不到两年时间，已经包含众多 SOTA 计算机视觉算法。OpenMMLab 在Github上不是一个单独...
如何解决NLP分类任务的11个关键问题：类别不平衡&低耗时计算&小样本&鲁棒性&测试检验&长文本分类 JayLou娄杰
2021-01-15 14:43

stay_foolish12的博客欢迎关注《高能AI》公众号～声明：文中观点谨代表笔者个人立场，盲目搬运有风险～在2020这个时间节点，对于NLP分类任务，我们的关注重点早已不再是如何构造模型、拘泥于分类模型长什么样子了。如同CV领域当前的重点...
面向不平衡数据的电子病历自动分类研究
2022-07-27 08:00

米朵儿技术屋的博客基于机器学习进行文本分类的基本思想是在利用规则或特征工程对文本内容进行特征提取的基础上。最终利用类别数量比例、梯度协调机制和类别相似度从样本数量不平衡和样本分类难度不平衡两个角度设计了新的损失函数。...
大厂必考深度学习算法面试题总结
2022-09-08 20:57

嵌入式视觉的博客三，深度学习框架的张量形状格式图像张量的形状有两种约定，通道在前（channel-first）和通道在后（channel-last）的约定，常用深度学习框架使用的数据张量形状总结如下： Pytorch/Caffe: (N, C, H, W)；...
本周NLP、CV、机器学习论文精选推荐
2018-12-21 15:07

PaperWeekly的博客在碎片化阅读充斥眼球的时代，越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里，你会快速 get 每篇精选论文的亮点和痛点，时刻紧跟 AI 前沿成果。点击本文底部...
NLP小白的Kaggle一轮游总结
2019-01-29 15:25

TFknight的博客博主大三，一月中旬期末考试结束之后都放在这个比赛上面了--Quora Insincere Questions Classification。大半个月过来，做了很多尝试，线下成绩提高了...该竞赛是个典型的文本二分类问题，用的是美国的知乎（quora...
算法面经汇总（1）
2020-02-26 12:00

pyxiea的博客文章目录项目编程算法和数据结构pythonSQLLinux数学AI通用统计机器学习深度学习NLP其他项目有些公司一面基本都是聊项目和比赛，项目细节问的很多，通用技术问题没怎么问 1、项目中用到哪些技术，然后会针对这些...
推荐 | 零基础小白学PyTorch.pdf
2020-12-08 11:20

Pysamlam的博客【机器学习炼丹术】的《小白学PyTorch》系列文章被很多人好评。<<小白学PyTorch>>扩展之Tensorflow2.0 | 21Keras的API详解（...
广告行业中那些趣事系列49：oCTS：一个标注人员都可以优化分类器的训练系统...
2022-01-16 18:19

数据拾光者的博客导读：本文是“数据拾光者”专栏的第四十九篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍我们构建的oCTS分类器优化训练系统，一个标注人员都可以优化分类器的训练系...
MATLAB算法实战应用案例精讲-【图像处理】目标检测（补充篇）
2023-11-08 00:30

林聪木的博客 FPN在RPN中的应用如何解决小目标识别问题介绍目标检测RCNN系列和Yolo系列的区别 YOLO和SSD区别前景背景样本不均衡解决方案：Focal Loss,GHM与PISA 如何解决训练数据样本过少的问题如何解决类别不平衡的问题 ...
没有解决我的问题, 去提问

悬赏问题

¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3

有人把GHM loss用在NLP领域里过吗

1条回答 默认 最新

悬赏问题

1条回答默认最新