动手学深度学习第三章线性回归的简介实现，为什么我的损失是这样的

动手学深度学习第三章线性回归的简介实现：


import torch
from torch import nn
from d2l import torch as d2l
from torch.utils import data

#               生成数据集
true_w = torch.tensor([2,-3.4])
true_b = 4.2
features,labels = d2l.synthetic_data(true_w,true_b,1000)



#               读取数据集
def load_array(data_array,batch_size,is_train=True):
    dataset = data.TensorDataset(*data_array)
    return data.DataLoader(dataset,batch_size,shuffle=True)

batch_size = 10
data_iter = load_array((features,labels),batch_size)
# print(next(iter(data_iter)))



#               定义模型
net = nn.Sequential(nn.Linear(2,1))
net[0].weight.data.normal_(0,0.01)
net[0].bias.data.fill_(0)



#               定义损失函数
loss = nn.MSELoss()



#               定义优化算法
trainer = torch.optim.SGD(net.parameters(),lr = 0.03)



#               训练
num_epochs = 3
for epoch in range(num_epochs):
    for X,y in data_iter:
        l = loss(net(X),y)
        trainer.zero_grad
        l.backward()
        trainer.step()
    l = loss(net(features),labels)
    print(f'epoch {epoch + 1},loss {l:f}')

出来的结果：
epoch 1,loss 36.045746
epoch 2,loss 106.395393
epoch 3,loss 152.102753

为什么我的损失越来越大了，而且我照着动手学深度学习书上代码一样敲得，为什么别人第一个epoch就是0.000291，我的这么大呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
香格里辣 2024-10-12 12:40
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

你的代码和书中的代码大致相同，但存在一些差异可能导致你的损失函数值较大。以下是可能的原因和解决方案：

数据生成方式：你使用的是d2l.synthetic_data生成的数据集，这意味着每次运行代码时生成的数据是不同的。因此，即使你按照书中的代码完全复制，由于数据的随机性，结果可能会有所不同。此外，书中可能使用了固定的随机数种子来确保每次生成的数据相同，而你没有设置随机数种子。为了更准确地比较结果，你可以尝试设置随机数种子。
初始化权重和偏置：你设置了权重的初始化方式为正态分布，均值为0，标准差为0.01。而书中可能使用了不同的初始化方式。尽管这可能会导致不同的起点损失值，但一般不会导致损失值逐渐增大。
学习率过高：你设置的学习率为0.03。如果学习率过高，可能会导致模型在优化过程中不稳定，从而使损失值增大。你可以尝试降低学习率，例如设置为0.01或更低。
批量大小（Batch Size）：你设置的批量大小为10。较小的批量大小可能导致模型在每次迭代时更新的步长较大，从而导致损失值的波动。你可以尝试增加批量大小。

为了解决这个问题，你可以尝试以下修改：

设置随机数种子以确保每次生成的数据相同。
尝试降低学习率。
增加批量大小。
检查并确认你的数据和书中的数据是否完全一致。

此外，即使进行了上述修改，由于随机性和初始化的差异，你的结果仍然可能与书中的结果有所不同。只要你的损失值随着训练的进行而逐渐下降，并且模型在训练集上的表现良好，那么你的实现就是正确的。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

《动手学深度学习2.0-李沐Pytorch版》
2025-07-24 15:36

内容概要：《动手学深度学习2.0-李沐Pytorch版》是一本结合理论与实践的深度学习教材，旨在帮助读者掌握深度学习的核心概念和实践技能。全书分为三个主要部分：基础知识和预备知识、现代深度学习技术和应用、以及可...
【Dive into Deep Learning / 动手学深度学习】第三章 - 第二节：线性回归的从零开始实现
2022-05-21 21:18

海轰Pro的博客简介：因C语言结识编程，随后转入计算机专业，获得过国家奖学金，有幸在竞赛中拿过一些国奖、省奖…已保研。学习经验：扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语！唯有努力知其然知其...
吴恩达深度学习第三章编程作业搭建神经网络含有一个隐藏层
2024-12-01 16:54

深度学习是目前人工智能领域的重要分支，它通过模拟人脑神经网络的工作方式来实现复杂的机器学习任务。深度学习的核心在于构建和训练多层神经网络，其中包含一个或多个隐藏层。本文档是一份关于深度学习编程作业的...
《动手深度学习》线性回归简洁实现实例
2023-10-31 08:00

Muti-Agent的博客 CSDN博客专家，华为云享专家，Linux、C/C++、云计算、物联网、面试、刷题、算法尽管咨询我，关注我，有问题私聊！
【李沐】动手学深度学习 学习笔记
2023-03-21 13:27

chenxiaowai_的博客这是【李沐】动手学深度学习v2-基于pytorch版本的学习笔记教材源代码安装教程（安装pytorch不要用pip，改成conda，pip太慢了，下载不下来）个人推荐学习学习笔记本节代码文件在源代码文件的chapter_deep-learning-...
PyTorch深度学习框架第9天：线性回归实现（波士顿房价预测实战）
2025-02-27 14:53

凡人的AI工具箱的博客 PyTorch深度学习框架第9天：线性回归实现（波士顿房价预测实战）！如果文章对你有帮助，还请给个三连好评，感谢感谢！
2025三掌柜赠书活动第一期：动手学深度学习（PyTorch版）
2025-01-02 11:08

三掌柜666的博客 深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理、游戏智能等领域取得了显著的进展。PyTorch，作为一个开源的深度学习框架，因其动态计算图、易用性和灵活性而受到广泛欢迎。那么本文就来详细介绍...
动手学习深度学习——基本简介
2021-11-20 14:14

X_Imagine的博客参考项目：李沐的书籍《动手学习深度学习》，第二版。英文原文链接：https://d2l.ai/chapter_introduction/index.html#unsupervised-and-self-supervised-learning 1. 简介直到最近，几乎我们接触到的每一个...
ML 系列：机器学习和深度学习的深层次总结(05)非线性回归
2024-09-21 11:14

无水先生的博客非线性回归是指因变量和自变量之间存在非线性关系的模型。该模型比线性模型更准确、更灵活，可以获取两个或多个变量之间复杂关系的各种曲线。
深度学习 神经网络（4）线性回归-Pytorch实现房价预测
2022-10-29 14:51

李乾文的博客波士顿房价预测是神经网络线性回归的一个典型应用案例。本文使用pytorch来的两种方式实现。一种是原生运算思想的矩阵运算，便于理解底层实现；一种是高度封装的更加方便的Sequential方式。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月12日

动手学深度学习第三章线性回归的简介实现，为什么我的损失是这样的

2条回答 默认 最新

问题事件

2条回答默认最新