深度学习softmax回归提问

以下是我的代码，想问一下运行后为何出现如图所示错误？（NotImplementedError: Module [FlattenLayer] is missing the required "forward" function）该如何修改？


import torchvision
import torchvision.transforms as transforms
import torch
from torch import nn
from torch.nn import init
import numpy as np
import sys
sys.path.append("C:/Users/zyx20/Desktop/深度学习编程/pythonProject")
import d2lzh_pytorch as d2l
batch_size = 256
if sys.platform.startswith('win'):
    num_workers = 0  # 0表示不用额外的进程来加速读取数据
else:
    num_workers = 4

mnist_train = torchvision.datasets.FashionMNIST(root='C:/Users/zyx20/Desktop/深度学习编程/MNIST/raw', train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(root='C:/Users/zyx20/Desktop/深度学习编程/MNIST/raw', train=False, download=True, transform=transforms.ToTensor())
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

num_inputs=784
num_outputs=10
class LinearNet(nn.Module):
    def __init__(self,num_inputs,num_outputs):
        super(LinearNet,self).__init__()
        self.linear=nn.Linear(num_inputs,num_outputs)
    def forward(self,x):
        y=self.linear(x.view(x.shape[0],-1))
        return y

net=LinearNet(num_inputs,num_outputs)

class FlattenLayer(nn.Module):
    def __init__(self):
        super(FlattenLayer,self).__init__()
    def foward(self,x):
        return x.view(x.shape[0],-1)
from collections import OrderedDict
net=nn.Sequential(
    #FlattenLayer(),
    #nn.Linear(num_inputs,num_outputs)
    OrderedDict([('flatten',FlattenLayer()),
                 ('linear',nn.Linear(num_inputs,num_outputs))])
)
init.normal_(net.linear.weight,mean=0,std=0.01)
init.constant_(net.linear.bias,val=0)
#定义交叉熵损失函数
loss=nn.CrossEntropyLoss()
#定义优化算法
optimizer=torch.optim.SGD(net.parameters(),lr=0.1)
#训练模型
num_epochs=5
def train_ch3(net,train_iter,test_iter,loss,num_epochs,batch_size,params=None,lr=None,optimizer=None):
    for epoch in range(num_epochs):
        train_l_sum,train_acc_sum,n=0.0,0.0,0
        for X,y in train_iter:
            y_hat=net(X)
            l=loss(y_hat,y).sum()

            #梯度清零
            if optimizer is not None:
                optimizer.zero_grad()
            elif params is not None and params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()

            l.backward()
            if optimizer is None:
                d2l.sgd(params,lr,batch_size)
            else:
                optimizer.step()

            train_l_sum+=l.item()
            train_acc_sum+=(y_hat.argmax(dim=1)==y).sum().item()
            n+=y.shape[0]
        test_acc=evaluate_accuracy(test_iter,net)
        print('epoch %d,loss %.4f,train acc %.3f,test acc %.3f'%(epoch+1,train_l_sum/n,train_acc_sum/n,test_acc))
train_ch3(net,train_iter,test_iter,loss,num_epochs,batch_size,None,None)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2024-01-28 14:06
关注
【相关推荐】

这篇文章：深度学习：softmax激活实现多元分类也许能够解决你的问题，你可以看下
您还可以看一下李立宗老师的讲给入门者的深度学习课程中的 softmax函数小节, 巩固相关知识点
除此之外, 这篇博客: 动手学深度学习图像分类数据集(二) softmax回归的从零开始实现中的 计算分类准确率 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

解析:
给定一个类别的预测概率分布y_hat ，我们把预测概率最大的类别作为输出类别。如果它与真实类别y 一致，说明这次预测是正确的。分类准确率即正确预测数量与总预测数量之比。

def accuracy(y_hat, y): return (y_hat.argmax(dim=1) == y).float().mean().item()

举例说明: 假设对于一个三分类问题,其预测值 y_hat如下真实值y如下
[0.1000, 0.3000, 0.6000] 代表对于第一个样本, 每个类别的概率值

argmax(dim=1) 函数的作用是返回每一行最大值的索引
在这里刚好标签对应的就是索引, 最大值对应的是最大概率所以这个所以就是我们预测的标签值
y_hat.argmax(dim=1) == y判断预测值是否与真实值相等

最终的结果计算出了准确率

放到本题的模型中,计算分类准确率

def evaluate_accuracy(data_iter, net): acc_sum, n = 0.0, 0 for X, y in data_iter: acc_sum += (net(X).argmax(dim=1) == y).float().sum().item() n += y.shape[0] return acc_sum / n

print(evaluate_accuracy(test_iter, net))

0.0647

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

softmax回归的softmax运算与交叉熵损失函数 mxnet python 机器学习
2022-08-03 20:22

回答 1 已采纳数值不稳定应该是说指数爆炸的问题，exp(50)可能编译器还能给你计算出来，那exp(5000)呢？此时python下面一般是返回inf。那么交叉熵损失函数里面的log(inf) 结果也是inf，这就
关于#深度学习知识蒸馏算法loss函数计算#的问题？ python 人工智能深度学习
2022-08-12 14:57

回答 1 已采纳原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好
softmax到底该怎么使用 cnn python 深度学习
2022-12-10 13:34

回答 1 已采纳望采纳在深度学习中，softmax函数是一种常用的分类函数，它可以将输入的多个数值映射到一个0到1之间的概率分布。通常，在神经网络中，softmax函数会被用作输出层的激活函数，用来对多分类问题进行预
动手学深度学习——softmax回归（原理解释+代码详解）
2023-07-16 10:09

緈福的街口的博客 softmax回归 1.1 分类问题 1.2 网络架构 1.3 全连接层的参数开销 1.4 softmax运算 1.5 小批量样本的矢量化 1.6 损失函数 1.6.1 对数似然 1.6.2 softmax及其导数 1.6.3 交叉熵损失 1.7 信息论基础 1.7.1 熵 1.7.2 ...
深度学习准确率很低的原因 python tensorflow 机器学习神经网络
2021-02-08 23:17

回答 1 已采纳有二个地方要改一下， kernel_size[0],kernel_size[1]->kernel_size，要以元组形式参数传入. 运行的片断，准确率在98%左右： Epoch 3/1
【深度学习】使用自己写的VGG16网络训练精度不提升 pytorch 深度学习神经网络
2022-05-30 00:00

回答 2 已采纳删除最后的softmax层，在内个relu之前加归一化就好了
python深度学习分类后的混淆矩阵的意义 python 人工智能机器学习深度学习神经网络
2019-09-13 16:13

回答 1 已采纳这是因为你在倒数第五行有一句‘print(predict3\_train)’啊，所以输出了它的维度
【动手学深度学习】softmax回归
2022-08-14 15:29

xyy ss的博客【动手学深度学习】softmax回归
minst深度学习例程不收敛，成功率始终在十几 tensorflow 深度学习
2020-01-25 18:05

回答 2 已采纳 https://blog.csdn.net/qq_32241189/article/details/80450741
softmax在代码的哪里？ python 深度学习计算机视觉
2023-04-16 09:18

回答 2 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7649031这篇博客也不错, 你可以看下softmax pytorch从零实现的代码除此之外, 这
多分类softmax问题使用binary_crossentropy tensorflow 人工智能机器学习深度学习神经网络
2020-05-26 15:57

回答 1 已采纳不知道你什么结果高很多，是loss高，还是acc高。一南一北两回事了。
深度学习：Softmax回归
2024-01-27 11:45

AAI机器之心的博客在前面，我们介绍了线性回归模型的原理及实现。线性回归适合于预测连续值，而对于分类问题的离散值则束手无策。因此引出了本文所要介绍的softmax回归模型，该模型是针对多分类问题所提出的。
softmax之后值不在0-1之间是为什么 pytorch 深度学习
2023-02-25 22:21

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵsoftmax函数是用于将输入转换为概率分布的函数。在输出结果中，每个元素都应该是介于0到1之间的值。但是，由于计算机内部浮点数的精度问题，在使用softmax函数时可能会
从零实现深度学习框架——Softmax回归简介
2022-01-17 19:50

愤怒的可乐的博客逻辑回归只能处理二分类问题，但是很多时候我们遇到的是多分类问题。此时就需要用到多元逻辑回归。
《动手学深度学习》softmax回归的从零开始实现
2022-09-12 23:56

认真学习！！！的博客大多数常见的深度学习模型都有类似的训练过程。通过更改它们的值，我们可以提高模型的分类精度。现在训练已经完成，我们的模型已经准备好对图像进行分类预测。给定一系列图像，我们将比较它们的实际标签（文本输出的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月28日

悬赏问题

¥15 vscode编译ros找不到头文件，cmake.list文件出问题，如何解决？(语言-c++|操作系统-linux)
¥15 通过AT指令控制esp8266发送信息
¥15 有哪些AI工具提供可以通过代码上传EXCEL文件的API接口，并反馈分析结果
¥15 二维装箱算法、矩形排列算法（相关搜索：二维装箱）
¥20 nrf2401上电之后执行特定任务概率性一直处于最大重发状态
¥15 二分图中俩集合中节点数与连边概率的关系
¥20 wordpress如何限制ip访问频率
¥15 自研小游戏，需要后台服务器存储用户数据关卡配置等数据
¥15 请求解答odoo17外发加工某工序的实操方法
¥20 IDEA ssm项目跳转页面报错500

深度学习softmax回归提问

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新