损失度一直是0但准确率正常波动该是哪里错了

求问！刚学机器学习，数据没问题，但是输出的这个损失度是不是不太对啊，怎么一直是0

train_data, train_label, test_data, test_label = load_dataset(dataset)
dataset = torch.utils.data.TensorDataset(torch.tensor(train_data), torch.tensor(train_label))  
dataloader = torch.utils.data.DataLoader(dataset, batch_size=40, shuffle=True)  

# 2. 模型定义 ---
model = nn.Sequential(  # 顺序模型
          nn.Linear(288, 100),  # 线性层
          nn.Sigmoid(),
          nn.Linear(100, 2)
        )

# 损失函数
loss = nn.CrossEntropyLoss()

# 准确率
def accuracy(y_pred, y_true):
    correct_pred = torch.eq(torch.argmax(y_pred, 1), y_true)  
    return torch.mean(correct_pred.float())


# 训练步
def train_step(model, x, y, opt):
    current_loss = loss(model(x), torch.argmax(y, 1))
    current_loss.backward() 
    with torch.no_grad():
        acc = accuracy(model(x), y)  
    opt.step()  
    opt.zero_grad()  
    return current_loss.item(), acc.item()


# 3. 创建模型 ---
opt = torch.optim.SGD(model.parameters(), lr=0.1)  # 标准梯度下降
ls = []  # 记录损失函数值
accs = []  # 记录准确率

# 4. 训练 ---
for _ in range(100):
    for batch_data, batch_label in dataloader:
        l, acc = train_step(model, batch_data, batch_label, opt)
        ls.append(l)
        accs.append(acc)

test_acc = accuracy(model(torch.tensor(test_data)), torch.tensor(test_label))
print("test acc:", test_acc.detach().data)
plt.plot(ls)
plt.plot(accs)
plt.legend(['loss', 'acc'])
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-03-20 20:56
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

在你的代码中，损失度（loss）始终为0的原因可能是因为你在计算损失时使用了torch.argmax(y, 1)。torch.argmax(y, 1)会返回y（也就是标签）中每个样本的最大概率索引，将其转换为one-hot编码形式。而nn.CrossEntropyLoss函数已经包含了将预测概率和one-hot编码标签比较的过程，不需要你手动进行转换。

因此，当你在计算损失时，你实际上是在比较模型的预测输出和它自己预测的概率最大值，这会导致损失始终为0，因为它们是相同的。

正确的做法是直接将未处理的y（batch_label）传给nn.CrossEntropyLoss，如下所示：

current_loss = loss(model(x), y)

这样，损失函数将会正确地计算预测概率分布和实际标签之间的交叉熵损失。修改后，你的训练过程应该能够反映出损失的变化。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

训练准确率正常，但是测试准确率为0？机器学习
2022-04-10 18:06

回答 1 已采纳这个要看你的代码了，首先确认下你的测试集数据以及测试代码正确，其次就是看你是一把epoch或者batch size计算一次还是多次epoch/batch size计算，这个也是有区别的
xgboost算法处理数据出现两个准确率是什么意思(语言-python) python
2022-05-02 19:23

回答 1 已采纳这你高低不得看看源码..程序输出的部分的代码肯定输出了俩不一样的变量
深度学习中，模型的准确率飘忽不定是什么回事 python 深度学习神经网络
2023-02-19 15:09

回答 2 已采纳模型的准确率飘忽不定可能有以下几个原因： 1.数据集不足：如果数据集很小，模型可能无法充分地学习数据集中的特征，因此准确率可能会随着不同的训练数据集的变化而变化。 2.模型结构：如果模型结构不合适，可
什么是深度学习？
2023-08-30 12:18

禅与计算机程序设计艺术的博客相对于传统机器学习算法，深度学习具有更高的准确率、鲁棒性、解决问题的能力和灵活性。同时，它也具备以下几个优势：更强的表达能力：由于深度学习模型能够捕获多层次的特征，因此可以对复杂的数据进行建模，从而...
用这个算逻辑回归准确率为什么是0啊，正确的怎么写啊？ python
2022-05-31 19:46

回答 1 已采纳害，第一个问题，你这个data3赋值的时候就有错了，应该把data改成data1不是吗，明明是两个不同的数据；第二个问题也是最关键的问题，你的预测的data1类型是int64，和你的credibili
LSTM的loss不断下降，但train和test的准确率始终在0.5左右 tensorflow 机器学习深度学习神经网络自然语言处理
2019-07-19 10:18

回答 3 已采纳 LSTM是用来做文本生成，做垃圾邮件识别似乎没有什么道理。你的loss用的可能是MSE，平方误差对于大的误差的减小比较敏感，但是对于最终的分类没有什么帮助，就导致acc没有什么变化loss一直下降
深度学习模型:训练出来的F1值比准确率高，写正常吗深度学习神经网络自然语言处理
2023-04-03 17:11

回答 2 已采纳 准确率和F1值都是常用的模型性能指标，通常用于评估分类问题的性能。准确率是正确分类的样本数与总样本数之比，而F1值是模型预测精度和召回率的加权平均值。F1值的计算方式将模型的准确率和召回率同时考虑，因
尼玛，刚聊完就弹窗推荐，这些 APP 是在偷听吗？
2020-11-05 10:00

吴师兄学算法的博客一旦偷听这种事情曝光，带来的负面影响对公司的股价以及形象的伤害是非常非常大的，像是阿里这样的公司，股价一有波动至少是数十亿美元的损失。别说偷听猜不透我们的喜好，即使能猜透又能带来多少的利润呢？双十一、...
神经网络训练集损失值降为0而且一直保持 python 深度学习神经网络
2022-02-25 12:13

回答 1 已采纳（1）你没有给出模型，数据情况，谁也分析不了（2）训练误差小，测试误差大，这是典型的过拟合（3）损失值降为 0，还是下降很快，接近于 0，这是完全不同的，从问题描述和图中看不出来
可是最终用测试集验证模型却只有0.3的准确率，请问是怎么回事啊？ tensorflow 人工智能机器学习深度学习
2021-02-25 00:59

回答 4 已采纳模型的泛化能力不行，即训练集数据覆盖范围小了，并没有覆盖到大部分情况。举个例子来说，你训练的数据都是圆形的，你用来测试矩形，那肯定不行啊。
请问图中是什么情况，训练集和测试集准确率、loss值变化不大 python tensorflow 深度学习神经网络自然语言处理
2020-05-07 13:18

回答 3 已采纳验证的正确率刚开始就接近1？你用的是一个已经训练好的模型吗？
一切皆是映射：使用神经网络进行异常检测
2024-07-19 00:44

禅与计算机程序设计艺术的博客然而，面对海量、高维度、实时变化的数据，传统的统计方法和基于规则的方法逐渐显示出局限性，特别是在数据分布发生变动时，其准确率和鲁棒性难以保证。 1.2 研究现状近年来，随着深度学习技术的发展，特别是神经...
一般外呼场景都是8k采样率的录音，假设模型都一样，8k和16k不同采样率训练出的模型准确率会有差距吗？人工智能自然语言处理语音识别
2022-07-22 17:19

回答 2 已采纳理论上模型一样的情况下，16k采样率的数据天然比8k效果会更好，训练的模型效果也会更好。但是如果是将8k的录音上采到16k，在走同样的模型，那么就不一定会更好了。不过一般来说更大的采样率可以搭配更深的
一切皆是映射：DQN在安全防御中的应用：智能检测与响应
2024-06-24 01:10

禅与计算机程序设计艺术的博客更新Q值：$Q(s_0, a_0) \leftarrow Q(s_0, a_0) + \alpha [r_0 + \gamma \max_{a'} Q(s_1, a') - Q(s_0, a_0)]$。通过不断与环境交互，代理逐渐学会在不同状态下采取最优的防御措施。 5.项目实践：代码实例和详细...
一切皆是映射：AI在金融市场预测中的角色
2024-07-17 00:56

禅与计算机程序设计艺术的博客书籍： -《深度学习》（Ian Goodfellow等人著） -《金融大数据分析与应用》（赵军著） 7.2 开发工具推荐 编程语言：Python 框架与库： TensorFlow PyTorch Pandas NumPy 7.3 相关论文推荐张旭东、何海林等人，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月20日

悬赏问题

¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵
¥15 cfx离心泵非稳态计算
¥15 动态列线图发布后出现An error has occurred. Check your logs or contact the app author for clarification.
¥20 VM虚拟机崩溃，重新登录故障，移除加密访问。
¥15 双VSG并网系统，matlab，状态变量稳态值求解
¥15 关于#Stata#的问题：数据是面板数据，SPSS里面不能控制年份和时间，所以只能用Stata做
¥20 基于基于NioEventLoop线程阻塞问题
¥20 我需要"hill48屈服模型等向强化非线性硬化"的abaqus本构子程序（umat或者vumat)对应的理论推导过程。
¥15 基于ucc28019的pfc电路中芯片一直不工作

损失度一直是0但准确率正常波动该是哪里错了

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新