Keras能train起来的模型，Pytorch训练一直出问题，很简单的模型

Keras能train起来的模型，Pytorch训练一直出问题，数据是完全一致的。
pytorch多了一段数据的整合和dataloader，其它都一样！

from torch.utils.data import DataLoader
from torch.utils.data import TensorDataset
data_kos = TensorDataset(X_kos, y_kos)
dataloader=DataLoader(data_kos,batch_size=64)

Pytorch代码：

import torch
import torch.nn as nn

# 定义模型
model = nn.Sequential(
    nn.Linear(30, 1000),   # 输入维度为15，输出维度为1000
    nn.ReLU(),             # 使用 ReLU 激活函数
    nn.Linear(1000, 100),  # 输入维度为1000，输出维度为100
    nn.ReLU(),             # 使用 ReLU 激活函数
    nn.Dropout(p=0.3),     # 使用 Dropout
    nn.BatchNorm1d(num_features=100),  # 使用 BatchNormalization
    nn.Linear(100, 1),     # 输入维度为100，输出维度为1
    nn.Sigmoid()           # 使用 Sigmoid 激活函数
)
import torch.optim as optim

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
epoch = 300
lr = 0.001
criterion = nn.BCELoss()
optimizer = optim.Adam(model.parameters(), lr)
#optimizer = optim.SGD(model.parameters(),lr=lr,momentum=0.9)
l = []
# 创建一个空列表来存储每个epoch的损失值
epoch_losses = []


#%%
# 训练模型
import time
start_time = time.time()
for epoch in range(epoch):
    model.train()
    batch_losses = []  # 用于存储当前epoch的每个batch的损失值
    for x, y in dataloader:
        x, y = x.to(device), y.to(device)
        y=y.view(-1,1)
        # print(y)
        # break
        optimizer.zero_grad()
        ht = model(x)
        loss = criterion(ht, y)
        loss.backward()
        optimizer.step()

        batch_losses.append(loss.item())  # 记录当前batch的损失值

    # 计算当前epoch的平均损失值
    epoch_loss = sum(batch_losses) / len(batch_losses)
    epoch_losses.append(epoch_loss)  # 将当前epoch的损失值添加到列表中

    # 输出当前epoch的损失值
    print("Epoch: {}, Average Loss: {:.6f}".format(epoch, epoch_loss))
end_time = time.time()
duration = end_time - start_time
print("程序运行时间为：", duration, "秒")

keras代码

model1 = Sequential()
model1.add(Dense(1000, activation='relu'))
model1.add(Dense(100, activation='relu'))
model1.add(Dropout(0.3))
model1.add(keras.layers.BatchNormalization())
model1.add(Dense(1, activation='sigmoid'))
from keras.optimizers import Adam,SGD
from keras.callbacks import EarlyStopping

adam = Adam()
model1.compile(optimizer=adam, loss='binary_crossentropy')
import time
start_time = time.time()
history_kos = model.fit(X_kos, y_kos,
                        epochs=300,
                        batch_size=64,
                        shuffle=True,
                        verbose=1)
end_time = time.time()
duration = end_time - start_time
print("程序运行时间为：", duration, "秒")

完全同样的数据，为什么keras能够正常的训练，loss也可以正常降低，但是pytorch的loss无法降低，最后的预测准确率也只有5%

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2024-02-10 13:18
关注
用BATCHNORM时，将其放在激活函数前

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(6条)

报告相同问题？

关注问题

深度学习框架探秘｜Keras 应用案例解析以及 Keras vs TensorFlow vs PyTorch
2025-02-14 14:09

紫雾凌寒的博客本文聚焦于 Keras 在图像分类和自然语言处理领域的案例分析。接着又对比了 Keras 和深度学习框架中的其他两大大框架 Keras 和 TensorFlow。
【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比：深度学习框架的终极指南
2024-11-21 11:47

XinZong-千鑫的博客为了更直观地了解三大框架的使用方式，下面我们将通过一个简单的手写数字识别（MNIST）任务，演示如何使用 PyTorch、TensorFlow 和 Keras 构建和训练一个基本的神经网络模型。通过以上简单的示例，我们可以看到，...
深度学习框架Keras与Pytorch对比
2024-03-07 09:30

AI大模型教程的博客 RAG 搭建一个简单的 ChatPDF 检索的基础概念什么是向量表示（Embeddings）向量数据库与向量检索基于向量检索的 RAG 搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署 … 第三阶段（30天）：...
大模型之Transformers ， PyTorch和Keras
2025-04-14 23:09

贾斯汀玛尔斯的博客 - **Transformers** 是一种强大的架构，专为自然语言处理任务设计，提供了大量预训练模型，...- **Keras** 是一个高层次的深度学习库，简化了模型构建和训练的流程，适合快速原型开发，通常与 TensorFlow 配合使用。
Keras 3.0发布：全面拥抱 PyTorch！
2024-06-17 14:02

Hello.Reader的博客 Keras 3.0 升级是对 Keras 的全面...在 train_step() 方法的主体中，实现了一个常规的训练更新，类似于您已经熟悉的内容。重要的是，我们通过 self.compute_loss() 计算损失，它包装了传递给 compile() 的损失函数。
Keras的未来：与PyTorch的对比和发展趋势
2023-12-31 01:33

光子AI的博客深度学习框架在过去的几年里取得了巨大的进步，成为人工智能领域的核心技术之一。Keras和PyTorch是两个最受欢迎的深度学习框架之一，它们各自具有独特的优势和特点。在本文中，我们将讨论Keras和PyTorch的未来发展...
基于Keras和PyTorch的CIFAR10图像分类模型实战：从数据加载到模型训练
2025-02-12 19:33

蟹黄味蚕豆的博客 CIFAR10是计算机视觉领域的经典入门数据集，适合验证小规模卷积神经网络的性能。本文将手把手教你用Keras构建一个**测试准确率超80%**的CNN模型，并详解数据增强、模型设计和训练技巧。
Pytorch学习（训练模型、网络、Transformer模型、UNet网络）
2025-10-16 15:47

FE_Jinger的博客 PyTorch是一个灵活易用的深度学习框架，其核心架构...通过简单的线性回归示例展示了PyTorch的工作流程：模型定义、损失函数设置、训练循环和预测。建议从张量基础开始，逐步掌握自动微分原理，最终深入专业领域应用。
Pytorch基础训练库Pytorch-Base-Trainer(支持模型剪枝分布式训练)
2022-01-24 11:09

AI吃大瓜的博客考虑到深度学习训练过程都有一套约定成俗的流程，鄙人借鉴Keras开发了一套基础训练库： Pytorch-Base-Trainer(PBT)；这是一个基于Pytorch开发的基础训练库，支持以下特征：
Tensorflow预训练模型转PyTorch
2024-08-07 09:09

新缸中之脑的博客深度学习领域是计算机科学中变化最快的领域之一。...一位同事在大量临床数据集上训练了一个分割模型，并报告了出色的性能。今天，我们的目标是在称为迁移学习的过程中，将该训练好的模型用于类似的目标。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 2月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月10日

Keras能train起来的模型，Pytorch训练一直出问题，很简单的模型

Pytorch代码：

keras代码

7条回答 默认 最新

问题事件

7条回答默认最新