动手学习深度学习LENET模型提问2

以下是我的代码，想问一下为何会出现Boolean value of Tensor with more than one value is ambiguous的错误？该如何修改呢？

import time
import torch
from torch import nn,optim
from torch.nn import init
import torchvision
import torchvision.transforms as transforms
import sys
sys.path.append("C:/Users/zyx20/Desktop/深度学习编程/pythonProject")
import d2lzh_pytorch as d2l
device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')

batch_size=256
if sys.platform.startswith('win'):
    num_workers = 0  # 0表示不用额外的进程来加速读取数据
else:
    num_workers = 4

mnist_train = torchvision.datasets.FashionMNIST(root='C:/Users/zyx20/Desktop/深度学习编程/MNIST/raw', train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(root='C:/Users/zyx20/Desktop/深度学习编程/MNIST/raw', train=False, download=True, transform=transforms.ToTensor())
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet,self).__init__()
        self.conv=nn.Sequential(nn.Conv2d(1,6,5),
                                nn.Sigmoid(),
                                nn.MaxPool2d(2,2),
                                nn.Conv2d(6,16,5),
                                nn.Sigmoid(),
                                nn.MaxPool2d(2,2))
        self.fc=nn.Sequential(
            nn.Linear(16*4*4,120),
            nn.Sigmoid(),
            nn.Linear(120,84),
            nn.Sigmoid(),
            nn.Linear(84,10)
        )
    def forward(self,img):
        feature=self.conv(img)
        output=self.fc(feature.view(img.shape[0],-1))
        return output
net=LeNet()

def evaluate_accuracy(data_iter,net,device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')):
    acc_sum,n=0.0,0
    with torch.no_grad():
        for X,y in data_iter:
            if isinstance(net,torch.nn.Module):
                net.eval()#评估模式，这会关闭dropout
                acc_sum+=(net(X.to(device)).argmax(dim=1)==y.to(device)).float().sum().cpu().item()
                net.train()#改回训练模式
            else:
                if('is_training' in net.__code__.co_varnames):#如果有is_training这个参数
                    #将is_training设置为False
                    acc_sum+=(net(X,is_training=False).argmax(dim=1)==y).float().sum().cpu().item()
                else:
                    acc_sum += (net(X).argmax(dim=1) == y).float().sum().cpu().item()
            n += y.shape[0]
    return acc_sum/n

def train_ch5(net,train_iter,test_iter,loss,num_epochs,batch_size,params=None,lr=None,optimizer=None):
    net=net.to(device)
    print("training on",device)
    loss=torch.nn.CrossEntropyLoss
    batch_count=0
    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum, n,start = 0.0, 0.0, 0,time.time()
        for X,y in train_iter:
            y_hat = net(X)
            X=X.to(device)
            y=y.to(device)
            l=loss(y_hat,y)
            optimizer.zero_grad()
            l.backward()
            optimizer.step()
            train_l_sum+=l.cpu().item()
            train_acc_sum+=(y_hat.argmax(dim=1)==y).float().sum().cpu().item()
            n += y.shape[0]
            batch_count+=1
        test_acc=evaluate_accuracy(test_iter,net)
        print('epoch %d,loss %.4f,train acc %.3f,test acc %.3f%,time %.lf sec'%(epoch+1,train_l_sum/batch_count,train_acc_sum/n,test_acc,time.time()-start))

lr,num_epochs=0.001,5
optimizer=torch.optim.Adam(net.parameters(),lr=lr)
train_ch5(net,train_iter,test_iter,num_epochs,batch_size,optimizer,device,num_epochs)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-03-03 10:35

关注

引自免费微信小程序：皆我百晓生

您在代码中提到的错误信息"Boolean value of Tensor with more than one value is ambiguous"并没有直接出现在您提供的代码片段中。通常，这个错误是因为尝试将一个多元素张量（如一个布尔张量）当作单一布尔值来使用，这在PyTorch中是不明确的。

在您的训练函数train_ch5中，我注意到您没有正确实例化损失函数torch.nn.CrossEntropyLoss。您需要创建一个损失函数对象而不是引用类本身。修改如下：

loss = torch.nn.CrossEntropyLoss()  # 实例化损失函数

此外，在调用train_ch5函数时，参数列表有误。不需要传入device和num_epochs两次，修正后的调用应该是：

train_ch5(net, train_iter, test_iter, loss, num_epochs, batch_size, optimizer=optimizer)

以下是修正后的完整训练部分：

def train_ch5(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None, optimizer=None):
    net = net.to(device)
    print("training on", device)
    if optimizer is None:
        optimizer = torch.optim.Adam(net.parameters(), lr=lr)

    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum, n, start = 0.0, 0.0, 0, time.time()
        for X, y in train_iter:
            y_hat = net(X)
            l = loss(y_hat, y)  # 使用实例化的损失函数计算损失
            optimizer.zero_grad()
            l.backward()
            optimizer.step()

            train_l_sum += l.cpu().item()
            train_acc_sum += (y_hat.argmax(dim=1) == y).float().sum().cpu().item()
            n += y.shape[0]

        test_acc = evaluate_accuracy(test_iter, net)
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f%%, time %.1f sec' %
              (epoch + 1, train_l_sum / (batch_count or 1), train_acc_sum / n, test_acc, time.time() - start))

# 正确实例化损失函数并训练模型
lr, num_epochs = 0.001, 5
loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
train_ch5(net, train_iter, test_iter, loss, num_epochs, batch_size, optimizer=optimizer)

这样应该能解决潜在的问题，并且能够正确运行LENET模型的训练过程。如果还有其他问题或者错误，请提供具体的错误信息以便更准确地定位问题所在。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

深度学习CNN中Lenet和优化器 cnn python 深度学习
2023-02-17 13:04

回答 3 已采纳 import torch import torchvision.models as models # 加载预训练的LeNet模型 model = models.lenet(pretrained=T
深度学习 模型 python python 人工智能深度学习
2023-04-19 19:30

回答 2 已采纳这篇文章：Python错误 TypeError: ‘NoneType‘ object is not subscriptable解决方案汇总也许能够解决你的问题，你可以看下除此之外, 这篇博客: an
深度学习测试时，加载模型出问题。 python 人工智能深度学习
2021-07-30 16:55

回答 2 已采纳 ckp和模型的维度数目不匹配，具体的你可以看看这个看下能不能改https://blog.csdn.net/qq_45128278/article/details/116588153
基于深度学习的加密流量识别模型源码：融合LeNet、AlexNet及GAP结构
2024-03-25 22:02

项目概述：本项目采用...整个项目由20个Python源文件、2个版本控制配置、2个Markdown说明文档、1个配置文件和1个LICENSE证书构成，提供了一种高效的网络流量分析工具，旨在通过先进的人工智能技术加强网络安全管理。
深度学习模型的问题。人工智能深度学习神经网络
2021-03-25 13:45

回答 2 已采纳只要模型结构不变，那么模型大小是一样的，只不过模型里面的超参会不一样，超参会随着数据和训练次数等因素变化。一般来说，同种类型的网络(像yolo5，有s,l,m,x四个大小的)，网络越大的效果会越好
深度学习模型ALbert程序跑动时出现的问题人工智能有问必答深度学习自然语言处理
2022-01-08 15:36

回答 1 已采纳网页连接超时，被重置，检查一下网址，看看用浏览器可否打开，不行就用代理。
深度学习预训练模型无法加载 python 深度学习计算机视觉
2022-07-21 14:33

回答 1 已采纳 model = your_networkmodel.load_state_dict(torch.load(model_weight_path, map_location=device))这只是个加载预
动手学深度学习-pytorch-源代码
2022-04-14 10:51

2. 模型构建：各种深度学习模型的定义，如LeNet、ResNet、LSTM等。 3. 训练循环：包括损失函数定义、反向传播、参数更新等训练过程。 4. 评估与测试：验证集上的模型性能评估，如准确率、混淆矩阵等。 5. 模型保存与...
深度学习中，模型的准确率飘忽不定是什么回事 python 深度学习神经网络
2023-02-19 15:09

回答 2 已采纳模型的准确率飘忽不定可能有以下几个原因： 1.数据集不足：如果数据集很小，模型可能无法充分地学习数据集中的特征，因此准确率可能会随着不同的训练数据集的变化而变化。 2.模型结构：如果模型结构不合适，可
【深度学习】如何绘制网络模型图深度学习神经网络
2023-03-20 15:19

回答 2 已采纳请看👉 ：如何绘制深度学习模型图？
Google Colab 连接SSH以使用学校的服务进行深度学习模型训练人工智能机器学习深度学习
2023-03-31 09:06

回答 1 已采纳有服务器还要colab干嘛-。-
动手学深度学习23 LeNet
2024-05-28 17:22

陌上阳光的博客卷积就是让每一层shape不断压缩变小【高宽减少】，通道数增多，把特征信息放到不同的通道里面。每一个通道认为是一个模式。...cnn explainer 看到每一个通道学习到的是什么东西。两层卷积+两层池化+两层全连接。
深度学习研究生电脑配置人工智能机器学习深度学习
2023-04-15 17:35

回答 2 已采纳您好，希望这个答案可以帮到您~对于深度学习，显卡的性能和显存都非常重要。显卡性能的强弱将直接影响深度学习模型的训练速度和精度，而显存大小则会影响您能够处理的数据量大小。针对您的需求，我会给您推荐一台
深度学习经典网络模型——LeNet
2023-06-21 15:05

小煜崽崽的博客 深度学习经典网络模型——LeNet
深度学习里面的网络模型绘图工具
2022-05-22 19:00

深度学习里面的网络模型绘图工具，用到了python语言。 http://alexlenail.me/NN-SVG/LeNet.html 正常的话是需要翻墙才能下载到，并且该服务器处于海外，下载速度对很慢很慢，亲测！所以还不如在这里下载！真的很划算...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月3日

悬赏问题

¥15 vscode编译ros找不到头文件，cmake.list文件出问题，如何解决？(语言-c++|操作系统-linux)
¥15 通过AT指令控制esp8266发送信息
¥15 有哪些AI工具提供可以通过代码上传EXCEL文件的API接口，并反馈分析结果
¥15 二维装箱算法、矩形排列算法（相关搜索：二维装箱）
¥20 nrf2401上电之后执行特定任务概率性一直处于最大重发状态
¥15 二分图中俩集合中节点数与连边概率的关系
¥20 wordpress如何限制ip访问频率
¥15 自研小游戏，需要后台服务器存储用户数据关卡配置等数据
¥15 请求解答odoo17外发加工某工序的实操方法
¥20 IDEA ssm项目跳转页面报错500

动手学习深度学习LENET模型提问2

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新