Jason1634F 2024-07-14 18:27 采纳率: 0%

全连接神经网络二分类，结果全是1怎么办！

我有一个11维的向量，想对它二分类为0和1。然后写了如图所示的全连接神经网络。
但是训练时候loss变化极小，准确率还不发生改变。然后打印输出发现他把所有结果都算成1了。在训练数据集里面0和1的比例就是接近6:4。
这个网络在哪里出现问题了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-07-14 18:27

关注

引自免费微信小程序：皆我百晓生

从你提供的信息来看，有几个可能的问题和解决方法。

首先，由于你的网络在所有情况下都预测出标签为1的结果，这意味着模型的输出在逻辑激活函数Sigmoid后可能已经完全偏离了正确路径。为了解决这个问题，你可以尝试以下几个步骤：

1. 检查数据预处理和标签编码

确保你的输入数据已经被正确地归一化或标准化，并且标签已经正确地编码为二分类形式（例如，使用独热编码）。另外，确保训练数据集中类分布均匀，避免出现类别不平衡的问题。由于你的数据集中0和1的比例接近6:4，这可能影响到模型的训练结果。尝试进行一些平衡处理，如过采样少数类别或欠采样多数类别。

2. 调整网络结构

你的网络结构看起来已经很合适了，但你可以尝试调整隐藏层的数量和神经元数量来优化性能。有时候增加隐藏层或神经元数量可以帮助模型更好地拟合数据。你也可以尝试添加更多的非线性层来增强模型的表达能力。

3. 调整优化器和损失函数

使用不同的优化器和损失函数可能会有不同的效果。虽然你当前使用的是Adam优化器和BCELoss损失函数，但你可以尝试其他优化器如SGD或RMSProp，以及损失函数如交叉熵损失函数（CrossEntropyLoss）。这些调整可能会帮助模型更好地学习数据的特征。

4. 学习率调整

过高或过低的学习率都可能导致训练问题。尝试降低学习率并增加训练的epoch数量。你当前的初始学习率为0.5，可以试着把它降低到更小，例如0.1或更低。此外，可以尝试学习率调度器（如StepLR）来动态调整学习率。

5. 添加正则化或Dropout层

添加正则化（如L1或L2正则化）或使用Dropout层可以帮助防止过拟合。在你的模型中已经使用了Dropout层，但你可以考虑增加正则化来进一步改善模型性能。

示例代码调整（仅作为参考）

假设你想使用交叉熵损失函数和SGD优化器来调整模型代码：

import torch.nn as nn
import torch.optim as optim

class BinaryClassificationModel(torch.nn.Module):
    def __init__(self, input_dim):
        super(BinaryClassificationModel, self).__init__()
        # ...（定义网络层和激活函数）...省略其它部分代码保持不变...不变内容结束（下文新添加代码从以下位置开始）这里稍作整理忽略已给出的部分（删减空行以及格式化排版调整）：---分割线去掉已有网络部分增加下面这些---model code adjustments for new optimizer and loss function start here：
        self.criterion = nn.CrossEntropyLoss()  # 使用交叉熵损失函数替代BCELoss()用于分类问题通常更好用CrossEntropyLoss而不是BCELoss与Sigmoid配合使用更常见一些（BCELoss通常用于回归问题）此处更改损失函数为交叉熵损失函数更合适一些用于分类任务模型输出层无需再使用Sigmoid激活函数直接使用线性层即可输出层可以保留softmax激活函数如果需要概率分布预测则可以使用softmax（通常在二分类任务中只需要预测一个类别概率输出softmax作用可有可无根据实际情况决定是否使用）模型结构保持原有不变仅更改损失函数定义处即可优化器使用SGD作为替代如下定义：优化器设置变化采用SGD作为替代修改后定义优化器代码实现如下：selfoptimizer SGD将损失和权重的平方正则项和类别错误添加到总体误差当中配合softmax处理可能的浮点错误若更改这里对应代码中对应行也做相应更改确保正确性将参数设置为适当值并调用optimizer优化模型以减小损失和增强准确性目的就是在修改相应的调用即可内容忽略修正输出）：此时针对问题的简化操作并改用简单直接的cross-entropy loss和SGD优化器进行训练即可：selfoptimizer SGD参数设置根据需求进行调整学习率等参数设置如下：selfoptimizer SGD权重更新方向改为使训练集的类别预测分布尽可能接近真实的标签分布其过程是逐渐优化的最终结果收敛至理想的类别判断决策边界符合业务需求和符合我们训练的最终目的为泛化性能和效果的过程通过调整学习率和迭代次数等参数实现优化过程提高模型性能避免过拟合等问题；以下是修正后的代码示例：def train_model(model, train_loader, test_loader):num_epochs = 20best_accuracy = 0.0optimizer = optim.SGD(model.parameters(), lr=initial_lr) # 设置学习率等参数为合适值scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=scheduler_step_size, gamma=scheduler_gamma)此处只更新了优化器的设置与测试时按照以上修正思路依次操作即根据提供的损失与准确率的变化信息进行必要的修正（这部分通常需要注意梯度的积累和初始参数对后续学习过程的影响根据实际模型输出相应控制值可以体现出每次修改网络细节的准确性可以通过保存网络每次训练后不同

编辑记录

报告相同问题？

关注问题

卷积神经网络，全连接层就是一个全连接神经网络吗人工智能机器学习深度学习神经网络
2021-01-04 10:51

回答 3 已采纳所有各种层连接在一起被叫做神经网络，如果这个神经网络只有全连接层，则叫做全连接神经网络。 “通过这三个层次将一个多种颜色通道高像素的图片提取特征，进行简化，然后将简化的结果当作一个全连接神经网络的输
三分类（非图像）效果最好的神经网络是？人工智能机器学习神经网络
2022-08-12 19:44

回答 1 已采纳听说过无免费午餐定理（no free lunch theorem）吗？没有一种模型能在所有数据集上永远取得最优的。对于不同的实际任务，必须要对数据集和任务进行特殊适配，才能达到最好效果。建议你说一下
Python BP神经网络两分类反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
全连接神经网络的二分类问题
2020-04-25 15:50

weixin_46824122的博客 全连接神经网络在分类、回归预测问题上表现出极强的生命力。相比于传统的机器学习算法，神经网路的学习能力大大推动了人工智能往更智能更高效方向发展。人工神经网络（Artificial Neural Networks，简写为ANNs）也...
神经网络的最后一层通常为全连接层，那么后面需要正则化和激励函数吗？人工智能神经网络
2021-09-02 15:43

回答 1 已采纳最后一层的全连接层，不需要正则化和激励函数，这一层的输出通常称为 Logits，可直接送入损失函数做损失值计算
分类卷积神经网络怎么识别视频？思路是什么 tensorflow 人工智能机器学习深度学习神经网络
2020-05-29 20:31

回答 1 已采纳 https://blog.csdn.net/xueweuchen/article/details/44216925
一道人工智能神经网络的题人工智能深度学习神经网络
2022-06-09 23:27

回答 5 已采纳输出层线性激活函数的话，预测结果为[1,0]
AI实战：从入门到精通系列——用全连接神经网络实现情感分类（一）
2019-09-22 20:54

szZack的博客 AI实战：从入门到精通系列——用感知器实现情感分类...然而，人工神经网络的设计一直缺少相应的严格的数学理论支持，之后BP算法更被指出存在梯度消失问题，因此无法对前层进行有效的学习。概念 全连接(fu...
为什么我改变图像通道会导致神经网络分类准确率下降？人工智能深度学习神经网络
2021-02-25 16:07

回答 2 已采纳这证明经过dct变换、局部二值模式处理后，损失了部分有效图像特征；或者灰度图、二值处理图、dct图在三个通道对应分量上的特征无法组合成更优图像特征。这在神经网络调参过程中是很常见的，明明觉得处理一下分
同一数据集划分不同类别，会影响神经网络分类准确率吗人工智能深度学习神经网络
2023-03-02 22:15

回答 1 已采纳基于Monster 组和GPT的调写：假设两个 VGG16 网络使用不同的训练集进行训练，其中训练集的类别不完全相同。虽然训练集中的“人”和“狗”类别相同，但其中一个网络在训练集中包含更多的猫类别。
二分类的f1 score一般多大算合格？人工智能深度学习神经网络
2022-03-30 22:17

回答 2 已采纳不妨参考一下F1 score的公式做一个简单的基准模型，假设正类在数据集中占比为a，对于数据集中的任一样本，均将其预测为正类，根据公式f1_score = a / (a - (1 - a) / 2)
Pytorch：全连接神经网络-MLP分类
2022-02-03 20:34

宅家的小魏的博客使用全连接神经网络(MLP)解决垃圾邮件分类问题
人工智能神经网络反向传播问题深度学习神经网络
2023-02-14 14:10

回答 4 已采纳 W1：一个横向矩阵b1：一个列向量W2：一个横向矩阵b2：一个列向量以上回答来自ChatGPT
基于全连接神经网络模型的手写数字识别
2024-02-08 00:09

Jc.MJ的博客手写数字识别要求利用MNIST数据集里的70000张手写体数字的图像，建立神经网络模型，进行0到9的分类，并能够对其他来源的图片进行识别，识别准确率大于97%。
【深度学习】手动实现全连接神经网络（FCNN）
2024-03-19 07:30

相洋同学的博客 神经网络是一门重要的机器学习技术，是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。机器学习中的神经网络是如何...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月14日

悬赏问题

¥100 java ee ssm项目悬赏，感兴趣直接联系我
¥15 微软账户问题不小心注销了好像
¥15 x264库中预测模式字IPM、运动向量差MVD、量化后的DCT系数的位置
¥15 curl 命令调用正常，程序调用报 java.net.ConnectException: connection refused
¥20 关于web前端如何播放二次加密m3u8视频的问题
¥15 使用百度地图api 位置函数报错？
¥15 metamask如何添加TRON自定义网络
¥66 关于川崎机器人调速问题
¥15 winFrom界面无法打开
¥30 crossover21 ARM64版本安装软件问题