如何解决python中softmax损失函数计算时的溢出问题？

     def loss(self,X,y,reg):
        loss = 0.0
        dW = np.zeros_like(self.W)

        num_train = X.shape[0]
        num_class = self.W.shape[1]

        one_hot = np.zeros(shape = (num_train,num_class))
        y = y.astype('int64')
        one_hot[np.arange(0,num_train), y] = 1  

        Z = X.dot(self.W)
        Z_max = np.max(Z,axis = 1,keepdims = True) #Z_max = Z.max(1).reshape(num_train,1)
        Z = Z - Z_max  #max(1) get the maxmum of each row
        score_E = np.exp(Z)
        Sum = np.sum(score_E,axis = 1,keepdims = True)#score_E.sum(axis = 1).reshape(num_train,1)  # sum of each row
        A = score_E/Sum   #score of every class of each training_example
        A1 = np.where(A > 0.0000000001, A, 0.0000000001)
        loss += -np.sum(one_hot*np.log(A1))/num_train + 0.5 * reg * np.sum(self.W * self.W)
        dW += -np.dot(X.T, one_hot - A) / num_train + reg * self.W
        return loss,dW

以上是我用python写的softmax的损失函数部分，但是在运行过程中发现输出里有时仍有这样的情况

我只对图片做了零均值化，没有归一化，但是Z = Z - Z_max 溢出就说不通啊，这是怎么回事，有没有大神解释？？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-10-20 16:34
关注
softmax你算的不对，公式你看下：https://www.cnblogs.com/liuyu124/p/7332476.html
它必然是0~1之间的，不可能溢出

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#深度学习知识蒸馏算法loss函数计算#的问题？ python 人工智能深度学习
2022-08-12 14:57

回答 1 已采纳原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好
softmax回归的softmax运算与交叉熵损失函数 mxnet python 机器学习
2022-08-03 20:22

回答 1 已采纳数值不稳定应该是说指数爆炸的问题，exp(50)可能编译器还能给你计算出来，那exp(5000)呢？此时python下面一般是返回inf。那么交叉熵损失函数里面的log(inf) 结果也是inf，这就
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
Softmax函数原理及Python实现过程解析
2020-09-16 20:26

Softmax函数是机器学习和深度学习领域中一种重要的激活函数，尤其在多分类问题中扮演着关键角色。它能够将一组实数值转化为概率分布，确保每个类别的概率和为1，使得模型的输出更加符合实际场景的需求。 ## Softmax...
softmax在代码的哪里？ python 深度学习计算机视觉
2023-04-16 09:18

回答 2 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7649031这篇博客也不错, 你可以看下softmax pytorch从零实现的代码除此之外, 这
（python）如何解决 ValueError: in user code:这个问题，能解决一下吗？ python tensorflow
2023-03-30 17:39

回答 2 已采纳这个错误通常是由于在模型训练过程中发生了数据类型或形状不匹配的错误导致的。要解决这个问题，需要检查代码中的数据处理部分，以确保输入和输出的形状和数据类型与模型的期望相匹配。以下是一些可能导致此错误的常
Python这是哪里的错误啊？ python tensorflow 人工智能
2022-12-17 16:58

回答 1 已采纳把你的第7行代码，data.files删除望采纳
python | softmax函数
2023-04-11 21:25

不吃辣椒️️的博客解决溢出问题，计算机处理“数”时，数值必须在 4字节或 8字节的有限数据宽度内。softmax函数的一个重要性质，可以把。函数的输出解释为“概率”。
关于#python#的问题：data.files python 神经网络
2022-11-29 17:16

回答 1 已采纳没有查到对应的files方法，不知你要的是不是tofile()方法
关于#takes 1 positional argument but 2 were given #的问题，如何解决？(语言-python) python sklearn 机器学习
2022-05-26 18:58

回答 2 已采纳好像是参数位置变了。你题目中13行改成这个试试self.vectorizer = CountVectorizer(max_df=max_df, stop_words=stopwords, ngram_
softmax分类器，分类概率都是nan是怎么回事？ python
2018-04-13 07:14

回答 3 已采纳你的测试准确率有问题，还不如随机分类的准确率，你在看一下。出现nan的原因可能是：真是label为[1,0]，预测的label是[0,1]，这样反向传播的weight和bias会无穷大，可能的解决
Python实现softmax函数
2019-03-03 18:15

AI吃大瓜的博客 Python实现softmax函数： PS：为了避免求exp(x)出现溢出的情况，一般需要减去最大值。 # -*-coding: utf-8 -*- import tensorflow as tf import numpy as np def softmax(x, axis=1): # 计算每行的最大值 ...
python错误解决 python
2020-11-28 20:59

回答 1 已采纳代码46行 for idx in range(x.size)改for idx in range(x.shape[0]):
softmax的数值溢出问题
2024-06-18 08:11

莫叶何竹的博客 softmax是deep learning常用的一个操作，虽然有很多现成的包可以调，但在某些场景下需要自己实现。...联用时（如计算cross-entropy损失），会出现。，此时应当进行如下变形。很大时，分子可能出现。
处理softmax函数上下溢出问题
2024-09-12 23:26

Thisiwycf的博客 softmax公式上下各除以exp(max)即可解决
没有解决我的问题, 去提问

悬赏问题

¥15 如何让企业微信机器人实现消息汇总整合
¥50 关于#ui#的问题：做yolov8的ui界面出现的问题
¥15 如何用Python爬取各高校教师公开的教育和工作经历
¥15 TLE9879QXA40 电机驱动
¥20 对于工程问题的非线性数学模型进行线性化
¥15 Mirare PLUS 进行密钥认证？（详解）
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
¥20 想用ollama做一个自己的AI数据库
¥15 关于qualoth编辑及缝合服装领子的问题解决方案探寻
¥15 请问怎么才能复现这样的图呀

如何解决python中softmax损失函数计算时的溢出问题？

2条回答 默认 最新

悬赏问题

2条回答默认最新