使用register_backward_hook() 获取不到梯度信息

问题遇到的现象和发生背景

我想使用register_backward_hook() 获取网络中间层特征图的梯度信息，用于生成热力图。但是程序进入register_backward_hook指定的函数后，输入和输出都是0张量。下面是我用的代码。请各位帮我看看吧，不然毕不了业了呀！

问题相关代码，请勿粘贴截图

class YOLOV5GradCAM:

def __init__(self, model, layer_name, img_size=(640, 640)):
    self.model = model
    self.gradients = dict()
    self.activations = dict()

    def backward_hook(module, grad_input, grad_output):
        self.gradients['value'] = grad_output[0]
        return None

    def forward_hook(module, input, output):
        self.activations['value'] = output
        return None

    target_layer = find_yolo_layer(self.model, layer_name)
    target_layer.register_forward_hook(forward_hook)
    target_layer.register_backward_hook(backward_hook)

    device = 'cuda' if next(self.model.model.parameters()).is_cuda else 'cpu'
    self.model(torch.zeros(1, 3, *img_size, device=device))
    print('[INFO] saliency_map size :', self.activations['value'].shape[2:])

def forward(self, input_img, class_idx=True):
    """
    Args:
        input_img: input image with shape of (1, 3, H, W)
    Return:
        mask: saliency map of the same spatial dimension with input
        logit: model output
        preds: The object predictions
    """
    saliency_maps = []
    b, c, h, w = input_img.size()
    tic = time.time()
    preds, logits = self.model(input_img)
    print("[INFO] model-forward took: ", round(time.time() - tic, 4), 'seconds')
    for logit, cls, cls_name in zip(logits[0], preds[1][0], preds[2][0]):
        if class_idx:
            score = logit[cls]
        else:
            score = logit.max()
        self.model.zero_grad()
        tic = time.time()
        # score.retain_grad()
        score.backward(retain_graph=True)
        print(f"[INFO] {cls_name}, model-backward took: ", round(time.time() - tic, 4), 'seconds')
        gradients = self.gradients['value']
        activations = self.activations['value']
        b, k, u, v = gradients.size()
        alpha = gradients.view(b, k, -1).mean(2)
        weights = alpha.view(b, k, 1, 1)
        saliency_map = (weights * activations).sum(1, keepdim=True)
        saliency_map = F.relu(saliency_map)
        saliency_map = F.upsample(saliency_map, size=(h, w), mode='bilinear', align_corners=False)
        saliency_map_min, saliency_map_max = saliency_map.min(), saliency_map.max()
        saliency_map = (saliency_map - saliency_map_min).div(saliency_map_max - saliency_map_min).data
        saliency_maps.append(saliency_map)
    return saliency_maps, logits, preds

def __call__(self, input_img):
    return self.forward(input_img)

运行结果及报错内容

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

batch_id是什么意思？ python
2022-07-25 16:55

回答 2 已采纳循环变量。是同时变化的enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标https://www.runoob.com/python
LSTM里seq_len的具体意义 lstm python pytorch
2023-01-01 10:00

回答 7 已采纳你说的这情况中，可能是希望使用五天的数据来预测第六天的输出。对于输入数据，序列长度（seq_len）通常表示使用多少时间步来进行预测。因此在情况中，seq_len应设为5。输入数据形状应为（batc
dev安装了不能使用，缺少mingw c++
2022-11-03 14:09

回答 3 已采纳重新安装，安装包有问题就在网上再找一个
register_backward_hook()和register_forward_hook（）
2022-03-08 11:17

xx_xjm的博客结论： 1：register_forward_hook（hook_fuc）中的hook_fuc函数需要有三个hook_func(model, input, output)这里的...2：register_backward_hook(hook_func)，首先要明确，这里的hook_func只有在网络执行backward（）
loss.backward()反向传播问题 python
2023-04-06 09:51

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客: RuntimeError: one of the variables needed for gradient computation
'Datasets' object has no attribute 'train_step' python tensorflow
2018-07-19 12:58

回答 2 已采纳请把xs, ys = mnist.train_step.next_batch(BATAH_SIZE)修改为xs, ys = mnist.train.next_batch(BATAH_SIZE)，就可以
LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
PyTorch的hook函数（register_hook、register_forward_hook、register_backward_hook、register_forward_pre_hook）
2023-10-16 15:21

Le0v1n的博客 1. register_hook 2. register_forward_hook 3. register_backward_hook 4. register_forward_pre_hook
找不到从页面返回的按钮 html php
2017-11-10 10:18

回答 1 已采纳 Replace your back button with following code.  <div style="float:right">
我在使用caffe进行训练的时候在未耗尽显存的情况下显示显存溢出人工智能深度学习
2019-02-27 14:28

回答 1 已采纳 ``` syncedmem.cpp:51 CaffeMallocHost(&cpu_ptr_, size_, &cpu_malloc_use_cuda_); ``` 从报错的代码点来看
关于GradNorm（深度学习里面多任务学习的权重设计梯度归一化）代码debug错误 python 有问必答深度学习
2021-04-02 20:08

回答 4 已采纳可能跟叶子节点（最初定义的变量）有关，计算梯度的时候，只有叶子节点才会保留梯度，所有中间节点的grad在计算完backward()的时候为了节约内存都会被清除掉。建议检查最初定义的变量是否有改变。
register_backward_hook(hook)、register_forward_hook(hook)、register_forward_pre_hook(hook)方法学习笔记
2021-01-10 21:29

敲代码的小风的博客参考链接: register_backward_hook(hook) 参考链接: register_forward_hook(hook) 参考链接: register_forward_pre_hook(hook) 文档翻译: 文档翻译: 文档翻译:
preg_match允许字符串中的特定特殊字符 php
2016-10-28 06:54

回答 2 已采纳 If I correctly understand you want only this characters - backward slash,forward slash,single quot
Pytorch中的register_hook(梯度操作)
2022-05-07 15:14

木盏的博客对于高阶调参师而言，对神经网络梯度级别的操作的不可避免的。有时候，咱们需要把某一层的梯度拿出来分析，辅助特征图可视化（如GradCAM）；再比如，hook还可以做优化器设计的实验。 hook，在中文里就是“钩子”的...
register_hook和register_forward_hook记录
2022-02-17 20:54

超超爱AI的博客序言在模型剪枝，模型量化以及模型中间层...register_hook是为了获取反向计算的梯度值。 def get_grad(grad): print("backward grad is:", grad) x = 2 w = torch.randn((2, 1), requires_grad=True) print("init w
pytorch中register_hook以及register_forward_hook
2022-09-08 23:32

宇宙小菜菜的博客 pytorch中register_hook的作用
热力图的关键：利用register_hook获取梯度
2022-03-05 21:19

我是一个对称矩阵的博客 1、使用方法 ...首先需要注册一个钩子，当代码运行到涉及z的梯度（比如backward）时，会想起这里的钩子，并执行传入的函数hook_fn，其参数grad就是z的梯度，你可以将这个梯度保存下来，也可以如代码中
【pytorch学习】四种钩子方法（register_forward_hook等）的用法和注意点
2021-03-01 18:20

Brikie的博客为了节省显存（内存），pytorch在计算过程中不保存中间变量，包括中间层的特征图和非叶子张量的梯度等。有时对网络进行分析时需要查看或修改这些中间变量，此时就需要注册一个钩子（hook）来导出需要的中间变量...
【28】使用hook技术获取模型的中间梯度信息与中间特征输出
2022-03-12 16:24

Clichong的博客以下内容是关于使用hook技术来获取模型forward过程的特征矩阵以及backward过程的梯度信息。文章目录1. register_hook2. register_forward_hook3. register_backward_hook 1. register_hook 由于pytorch会自动舍弃...
【Pytorch】backward与backward_hook
2022-11-09 11:01

leSerein_的博客 pytorch中的backward和backward_hook用法，大部分为转载
没有解决我的问题, 去提问