使用torch.autograd.Function自定义激活函数时，如何在父类中对子类传入参数？

这里贴上yolov5的一个高效自定义激活函数的源码：

class MemoryEfficientMish(nn.Module):
    class F(torch.autograd.Function):
        @staticmethod
        def forward(ctx, x):
            ctx.save_for_backward(x)    # 表示forward()的结果要存起来，以后给backward()
            return x.mul(torch.tanh(F.softplus(x)))  # x * tanh(ln(1 + exp(x)))

        # grad_output是最终object对的forward()输出的导数, 也就是理解为上一层求导的结果
        # ctx是一个元祖
        @staticmethod
        def backward(ctx, grad_output):    # grad_output上一层求导的结果
            x = ctx.saved_tensors[0]       # ctx.saved_tensors得到之前forward()存的结果
            sx = torch.sigmoid(x)
            fx = F.softplus(x).tanh()
            return grad_output * (fx + x * sx * (1 - fx * fx))

    def forward(self, x):
        return self.F.apply(x)

这里我如何传入一个beta参数到子类F中去，也就是在父类MemoryEfficientMish中传入一个参数到子类F中，使得可以控制子类的forward与backward函数的返回。一个设想的伪代码实现如下：

class MemoryEfficientMish(nn.Module):

  # 可以传入参数beta，默认为1，也就是简化的版本
    def __init__(self, beta=1.):
        super().__init__()
        self.beta = beta

    class F(torch.autograd.Function):
        @staticmethod
        def forward(ctx, x):
            ctx.save_for_backward(x)    # 表示forward()的结果要存起来，以后给backward()
            
            # 传入参数beta使得可以控制返回函数
            if self.beta != 1.0:
                 return ...
            return x.mul(torch.tanh(F.softplus(x)))  # x * tanh(ln(1 + exp(x)))

        # grad_output是最终object对的forward()输出的导数, 也就是理解为上一层求导的结果
        # ctx是一个元祖
        @staticmethod
        def backward(ctx, grad_output):    # grad_output上一层求导的结果
            x = ctx.saved_tensors[0]       # ctx.saved_tensors得到之前forward()存的结果
            sx = torch.sigmoid(x)
            fx = F.softplus(x).tanh()

            # 传入参数beta使得可以控制返回函数
            if self.beta != 1.0:
                 return ...
            return grad_output * (fx + x * sx * (1 - fx * fx))

    def forward(self, x):
        return self.F.apply(x)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

请教一下torch.autograd.grad(y,x,create_graph=True)[0]这里的[0]是什么意思？ python pytorch 有问必答
2023-02-11 22:08

回答 5 已采纳的确，都说torch.autograd.grad返回的是第一参数对第二个参数的导数，一般是网络中的梯度，为什么都只取[0]，我也要去看下笔记查下。这一维度的具体意义
关于torch激活函数自定义 python pytorch 人工智能
2021-07-07 22:24

回答 1 已采纳原始Relu都是大于0的值，你想大于1的值，直接+1即可。关于shape一致，激活函数是不改变shape的。这还有什么问题吗?
想问问torch.nn.sigmoid()和torch.nn.funcitonal.sigmoid()的区别 pytorch 深度学习神经网络
2022-08-26 11:49

回答 3 已采纳 nn.Sigmoid()返回的是一个对象，torch.nn.funcitonal.sigmoid()是一个函数。nn.Sigmoid对象在其源代码中也是调用torch.nn.funcitonal.si
pytorch的自定义拓展之（三）——torch.autograd.Function的简单定义与案例
2019-10-12 11:35

LoveMIss-Y的博客前言：详细过程可以参考前面的两篇文章： pytorch的自定义拓展之（二）——torch.autograd.Function...一、使用autograd.Function 定义新的自动求导函数在底层，每一个原始的自动求导运算实际上是两个在Tens...
torch.uint8转换torch.float32卡住 python
2022-08-09 11:32

回答 1 已采纳已解决，具体可参考https://blog.csdn.net/Ang_Quantum/article/details/122496024
pytorch源码中“if torch._C._get_tracing_state():”怎么理解 python 人工智能神经网络
2021-02-10 15:57

回答 3 已采纳 if torch._C._get_tracing_state():就是用来判断是否使用JIT来跟踪模型。像pytorch构建一个计算图就会用到一个中央的context去管理变量，而JIT跟踪模型也类似
Python 该怎么下载一个叫torch._C的库呢？ github python pytorch
2022-01-14 16:11

回答 2 已采纳 pip3 install torchvision
Pytorch的自定义拓展:torch.nn.Module和torch.autograd.Function
2022-04-29 20:05

ChaoFeiLi的博客 pytorch的自定义拓展之（一）——torch.nn.Module和torch.autograd.Function_LoveMIss-Y的博客-CSDN博客_pytorch自定义backward前言：pytorch的灵活性体现在它可以任意拓展我们所需要的内容，前面讲过的自定义模型、...
typeError:an integer is required(got type torch.LongTensor) python
2021-10-25 09:46

回答 1 已采纳 typeError:an integer is required(got type torch.LongTensor)typeError:需要一个整数（获取torch.LongTensor类型）你打印
module 'torch.nn' has no attribute 'linear'。 list python 机器学习深度学习
2020-03-19 00:25

回答 2 已采纳 http://ddrv.cn/a/147680
出现module 'torch.jit' has no attribute 'script_if_tracing'报错，降低torchvision不好用，求解决方法 python vscode 有问必答
2022-03-14 16:48

回答 2 已采纳试试这样安装 torchvision 和torch: pip install torch==1.6.0+cpu torchvision==0.7.0 -f https://download.pytor
Pytorch autograd机制(三) —— torch.autograd.Function 自定义求导/反向传播方式
2022-04-20 21:00

hxxjxw的博客虽然pytorch可以自动求导，但是有时候一些操作是不...Function一般只定义一个操作，因为其无法保存参数，因此适用于激活函数、pooling等操作；Module是保存了参数，因此适合于定义一层，如线性层，卷积层，也适用于定.
遇到报错TypeError: 'torch.dtype' object is not callable怎么解决？ pycharm python 深度学习
2023-04-10 19:26

回答 2 已采纳基于Monster 组和GPT的调写：用mask_src.dtype，但dtype不是一个可调用的函数。用torch.Tensor对象的.dtype属性来获取其数据类型，而不是将其作为函数调用。 im
定义torch.autograd.Function的子类，自己定义某些操作，且定义反向求导函数
2018-02-26 12:11

tang-0203的博客哇,这个博客是对pytorch官方手册中-Extending PyTorch部分的的翻译总虽然pytorch可以自动求导，但是有时候一些操作是不可导的，这时候你需要自定义求导方式。也就是所谓的 “Extending torch.autograd”. 官网...
【Pytorch】基于torch.autograd.Function类自定义网络层
2020-03-26 08:18

guofei_fly的博客 torch.autograd.Function是pytorch中用于自定义张量操作函数的类，通过实现forward和backward方法分别定义前向计算和反向求导过程，从而实现自定义网络层在整个动态流图中计算的传递。先贴一张官方说明：在自定义...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月25日

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

使用torch.autograd.Function自定义激活函数时，如何在父类中对子类传入参数？

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新