softmax不知道哪里写错了，二分类预测的正确率为0.1左右。不知道哪里反了

从预测结果上看，预测的准确率极低，0.1左右。我觉得1-0.1=0.9才是理想结果，可能是哪里写反了，但我找不到哪里有问题。
代码，删去了很多不必要的部分（求cost之类的）：


import numpy as np
from function_set.activate_functions import sigmoid, reLU, tanh, softmax  # eval()会用到，不删
from function_set.activate_differential import sigmoid_d, reLU_d, tanh_d  # eval（）会用到，不删


class neural_network:
    def __init__(self,
                 layer_num=3,
                 dim_num_list=None,
                 funct_list=None,
                 a_functs=("tanh", "sigmoid"),
                 ):
        self.funct_list = funct_list  # 激活函数列表，记录每一层的激活函数
        self.layer_num = layer_num  # 层数
        self.dim_num_list = dim_num_list  # 每一层的结点数
        self.a_functs = a_functs  # 激活函数名
        self.paras = dict()  # 保存参数 W,b
        self.cache = dict()  # 存储前向传播的数据，供反向传播使用
        self.epsilon = 1e-8  # 精度，防止除0或log
        self.iter_cnt = 0  # 迭代计数, 用于momentum等优化

    def init(self, X, Y):
        if not self.dim_num_list:
            self.dim_num_list = np.random.randint(20, 31, self.layer_num + 1)  # 默认维度为30
        else:
            self.layer_num = len(self.dim_num_list) - 1
        if not self.funct_list:
            self.funct_list = list()
            for i in range(0, self.layer_num):
                self.funct_list.append(self.a_functs[0])
            self.funct_list.append(self.a_functs[1])
        self.dim_num_list[0] = X.shape[0]
        self.dim_num_list[self.layer_num] = Y.shape[0]
        self.init_paras()

    def init_paras(self):
        for i in range(1, self.layer_num + 1):
            self.paras["W" + str(i)] = np.random.randn(self.dim_num_list[i], self.dim_num_list[i - 1])
            self.paras["b" + str(i)] = np.zeros(self.dim_num_list[i], float).reshape(-1, 1)

    def forward_propagate(self, X):
        self.cache["A0"] = X
        for i in range(1, self.layer_num + 1):
            self.cache["Z" + str(i)] = np.dot(self.paras["W" + str(i)], self.cache["A" + str(i - 1)])
            self.cache["A" + str(i)] = eval(self.funct_list[i])(self.cache["Z" + str(i)])


    def backward_propagate(self, Y):
        A = self.cache["A" + str(self.layer_num)]
        m = A.shape[1]
        dA = (-1 / m) * Y * (1 / (A + self.epsilon))
        i = self.layer_num
        while (i > 0):
            function_name = self.funct_list[i]
            if (i == self.layer_num) and (function_name == "softmax"):  # 输出层
                dZ = (1 / m) * (A - Y)
            else:  # 隐藏层
                dZ = dA * eval(function_name + "_d")(self.cache["A" + str(i)], self.cache["Z" + str(i)])
            self.cache["dW" + str(i)] = np.dot(dZ, self.cache["A" + str(i - 1)].T)
            self.cache["db" + str(i)] = np.sum(dZ, axis=1).reshape(-1, 1)
            dA = np.dot(self.paras["W" + str(i)].T, dZ)
            i -= 1

    def update_parameters(self, learning_rate):
        for i in range(1, self.layer_num + 1):
            self.paras["W" + str(i)] = self.paras["W" + str(i)] - learning_rate * self.cache["dW" + str(i)]
            self.paras["b" + str(i)] = self.paras["b" + str(i)] - learning_rate * self.cache["db" + str(i)]

    def fit(self, X, Y, learning_rate=0.5, iter_num=1000):
        self.init(X, Y)
        self.iter_cnt = 0
        for epoch in range(iter_num):
            self.iter_cnt += 1
            self.forward_propagate(X)
            self.backward_propagate(Y)
            self.update_parameters(learning_rate)

    def predict_probability(self, X):
        self.forward_propagate(X)
        return self.cache["A" + str(self.layer_num)]

    def predict(self, X):
        probabilty = self.predict_probability(X)
        print(probabilty)
        return self.map_to_int(probabilty)

    def map_to_int(self, A):  # 概率转预测结果
        result = None  #
        if self.funct_list[self.layer_num] == "softmax":
            result = np.argmax(A, axis=0)
        return result

    def get_one_hot(self, y, class_num):  # 将整数类别转换为独热编码
        n = class_num
        m = len(y)
        result = np.zeros((n, m))
        for i in range(m):
            result[y[i]][i] = 1
        return result


def test(X_train, Y_train, X_test, Y_test):
    L = [2, 30 , 1]
    nn = neural_network(dim_num_list=L, a_functs=("tanh", "softmax"))  # a_functs[0]是隐藏层函数名，a_functs[1]是输出层函数名
    nn.fit(X_train, Y_train, learning_rate=0.1, iter_num=1000)
    result = nn.predict(X_test)
    y = Y_test[0]
    print("实际值 = ", y)
    print("预测值 = ", result)
    cnt = 0
    for e in range(len(y)):
        if result[e] == y[e]:
            cnt += 1
    print("准确率 = ", cnt / len(y))


from planar_utils import load_planar_dataset

X_train, Y_train = load_planar_dataset()
X_train /= 4
# plt.scatter(X_train[0, :], X_train[1, :], c=Y_train, s=40, cmap=plt.cm.Spectral) #绘制散点图
# plt.show()
X_test, Y_test = load_planar_dataset()
X_test /= 4

Y_train = neural_network().get_one_hot(Y_train[0], 2)
Y_test = neural_network().get_one_hot(Y_test[0], 2)

test(X_train, Y_train, X_test, Y_test)

运行结果：

实际值 =  [1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
预测值 =  [0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0
 0 0 0 1 1 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 1 1 0 1 1 1 0 1 0 0 1 1 1
 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 1 1
 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0]
准确率 =  0.1175

下面是激活函数和对应微分的代码，因为最后是直接对Z求的导，所以softmax的微分函数就pass了


import numpy as np


def sigmoid(Z):
    positive_mask = (Z >= 0)
    negative_mask = Z < 0
    result_positive = 1 / (1 + np.exp(-Z * positive_mask))
    result_positive[~positive_mask] = 0
    result_negative = np.exp(Z * negative_mask) / (np.exp(Z * negative_mask) + 1)
    result_negative[~negative_mask] = 0
    result = result_negative + result_positive
    return result


def reLU(Z):
    return np.maximum(0, Z)


def tanh(Z):
    return np.tanh(Z)


def softmax(Z):
    max_Z = np.max(Z, axis=0)
    return np.exp(Z - max_Z) / np.sum(np.exp(Z - max_Z), axis=0)


import numpy as np


def sigmoid_d(A, Z):
    return A * (1 - A)


def reLU_d(A ,Z):
    result = (Z > 0) * 1
    return result


def tanh_d(A, Z):
    return 1 - A * A


def softmax_d(A, Z):
    pass

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
东方佑 2022-07-29 00:10
关注
很明显你训练的时候标注的和验证时标注的是反的调整一下就可以了 0 看做1 1 看做0 就好

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

softmax不知道哪里写错了，二分类预测的正确率为0.1左右。不知道哪里反了 python 深度学习神经网络
2022-07-27 18:30

回答 1 已采纳很明显你训练的时候标注的和验证时标注的是反的调整一下就可以了 0 看做1 1 看做0 就好
softmax分类器，分类概率都是nan是怎么回事？ python
2018-04-13 07:14

回答 3 已采纳你的测试准确率有问题，还不如随机分类的准确率，你在看一下。出现nan的原因可能是：真是label为[1,0]，预测的label是[0,1]，这样反向传播的weight和bias会无穷大，可能的解决
softmax之后值不在0-1之间是为什么 pytorch 深度学习
2023-02-25 22:21

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵsoftmax函数是用于将输入转换为概率分布的函数。在输出结果中，每个元素都应该是介于0到1之间的值。但是，由于计算机内部浮点数的精度问题，在使用softmax函数时可能会
自然语言处理（NLP）基础知识大全
2023-08-07 00:23

禅与计算机程序设计艺术的博客另一方面，随着人工智能技术的兴起，机器学习、深度学习、自然语言处理等人工智能技术也越来越火热。经过几十年的研究和实践，人工智能目前已经进入了一个高速发展阶段，它的算法和技术正在飞速进步。
用pytorch写了一个经典的鸢尾花分类 pytorch 分类机器学习
2022-10-25 10:18

回答 2 已采纳尝试把batch size调小，或者学习率调小点试试。
python深度学习分类后的混淆矩阵的显示方式为什么不是单纯的一个矩阵 python 人工智能机器学习深度学习神经网络
2019-09-11 00:07

回答 1 已采纳 https://blog.csdn.net/qq_36982160/article/details/80038380
softmax在代码的哪里？ python 深度学习计算机视觉
2023-04-16 09:18

回答 2 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7649031这篇博客也不错, 你可以看下softmax pytorch从零实现的代码除此之外, 这
石油专业：一文入门机器学习，以测井岩性分类预测为例
2020-07-18 19:41

在下菜鸡的博客石油专业：一文入门机器学习，以测井岩性分类预测为例，不被骗1 前言1.1 机器学习的相关背景1.2 机器学习的八股文2 模型实战2.0 导入相关库2.1 数据处理2.1.1 数据读取2.1.2 缺失值处理2.1.3 样本类别均衡2.1.4 样本...
手写数字识别，神经网络交叉商结果正确，正确率总是不变深度学习神经网络
2018-09-18 12:53

回答 3 已采纳 正确率是多少？如果保持在0.1左右，说明没有学习到（因为有10个分类，随机的权重识别出来正确概率就是0.1） Adam换成SGD，学习率设置小一点看看。调试下，输出下损失函数的损失率。
多分类softmax问题使用binary_crossentropy tensorflow 人工智能机器学习深度学习神经网络
2020-05-26 15:57

回答 1 已采纳不知道你什么结果高很多，是loss高，还是acc高。一南一北两回事了。
【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
使用Pyhon+Flux+Julia实现手写数字识别
2020-09-12 23:18

woshicver的博客如果标签是一个不一定有用的数字，例如如果输出是一系列邮政编码，那么将3000的邮政编码视为1500的邮政编码的两倍是没有意义的，同样，当使用神经网络从图像中预测数字时，4的大小是2的两倍并不重要，数字也可能是...
minst深度学习例程不收敛，成功率始终在十几 tensorflow 深度学习
2020-01-25 18:05

回答 2 已采纳 https://blog.csdn.net/qq_32241189/article/details/80450741
西瓜书重温(七): 贝叶斯分类器(手推+代码demo)
2022-06-24 19:15

翻滚的小@强的博客 1. 写在前面今天开始学习西瓜书第七章，有关贝叶斯分类器的基本知识，贝叶斯决策论是在概率框架下实施决策的基本方法，对分类任务，在所有相关概率已知时，贝叶斯决策论考虑如何基于概率和误判损失选择最优类别...
深度学习调参有哪些技巧？
2020-08-25 17:31

zenRRan的博客关注“深度学习自然语言处理”，一起学习一起冲鸭！设为星标，第一时间获取更多干货来源：知乎链接：https://www.zhihu.com/question/25097993编辑：王萌澳...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金10元 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金20元 7月28日
展开全部

悬赏问题

¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测
¥88 python部署量化回测异常问题
¥30 酬劳2w元求合作写文章
¥15 在现有系统基础上增加功能
¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码

softmax不知道哪里写错了，二分类预测的正确率为0.1左右。不知道哪里反了

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新