手写字母识别项目求解答

问题遇到的现象和发生背景

准确率太低，且变化不大

问题相关代码，请勿粘贴截图

# -*- coding: utf-8 -*-
from torchvision import datasets,transforms
import torchvision
from torch.utils.data import DataLoader
import torch
from torch import nn
import matplotlib.pyplot as plt
import receive_image
import torch.optim as optim
import numpy as np



#基本配置
#device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
batch_size = 16
lr = 1e-4
epochs = 20

#数据读入
image_size = 128
data_transform = transforms.Compose([
        #transforms.ToPILImage(),
        transforms.Resize(image_size),
        transforms.ToTensor()
        ])
receive_image.receiveImage()
train_path = 'D:\identify\data\data0-z_image'
train_data = datasets.ImageFolder(train_path,transform=data_transform)

val_path = 'D:\identify\data\data0-z_image_val'
val_data = datasets.ImageFolder(val_path,transform=data_transform)

train_loader = torch.utils.data.DataLoader(train_data,batch_size = batch_size,shuffle = True,drop_last = True)
val_loader = torch.utils.data.DataLoader(val_data,batch_size = batch_size,shuffle = False)
images,lables = next(iter(train_loader))

'''
#查看数据
print(images.shape,lables.shape)
plt.imshow(images[0][0])
'''
#模型构建
class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        self.conv = nn.Sequential(
                nn.Conv2d(3,32,5),
                nn.ReLU(),
                nn.MaxPool2d(2,stride = 2),
                nn.Dropout(0.3),
                nn.Conv2d(32,64,5),
                nn.ReLU(),
                nn.MaxPool2d(2,stride = 2),
                nn.Dropout(0.3)
                )
        self.fc = nn.Sequential(
                nn.Linear(64*29*45,512),
                nn.ReLU(),
                nn.Linear(512,36)
                )
    def forward(self,x):
        #print(x.shape)
        x = self.conv(x)
        #print(x.shape)
        x = x.view(-1,64*29*45)
        x = self.fc(x)
        return x
        
model  =Net()
#model = model.cuda()

#设置损失函数
criterion = nn.CrossEntropyLoss()#交叉熵损失函数
#设定优化器(Adam优化器)
optimizer  = optim.Adam(model.parameters(),lr = 0.000001)

#训练和测试
def train(epoch):
    model.train()
    train_loss = 0
    for data,lable in train_loader:
        #data,lable = data.cuda(),lable.cuda()
        #print(data,lable)
        optimizer.zero_grad()   #优化器梯度置零
        output = model(data)    #将data送入模型训练
        #print(output,lable)
        loss = criterion(output,lable)  #计算损失函数
    
        loss.backward() #将loss反向传播回网络
        optimizer.step()    #使用优化器更新模型参数
        train_loss += loss.item()*data.size(0)#注意要乘以batchsize
    #print(train_loss)
    train_loss = train_loss/len(train_loader.dataset)
    print('Epoch:{}\tTrain_loss:{:.6f}'.format(epoch,train_loss))
    
def val(epoch):
    model.eval()
    val_loss = 0
    get_lables = []
    pred_lables = []
    with torch.no_grad():
        for data,lable in val_loader:
            output = model(data)
            #print(output)
            #print(lable)
            pred = torch.argmax(output,1)
            #print(pred)
            get_lables.append(lable.cpu().data.numpy())
            pred_lables.append(pred.cpu().data.numpy())
            loss = criterion(output,lable)
            val_loss += loss.item()*data.size(0)
    val_loss = val_loss/len(val_loader.dataset)
    #print(get_lables,pred_lables)
    get_lables,pred_lables = np.concatenate(get_lables),np.concatenate(pred_lables)
    acc = np.sum(get_lables==pred_lables)/len(pred_lables)
    
    print('Epoch:{} \tValidation Loss:{:.6f},Accuracy:{:6f}'.format(epoch,val_loss,acc))

     
for epoch in range(1,epochs+1):
    train(epoch)
    val(epoch)

运行结果及报错内容

我的解答思路和尝试过的方法

每种类别字母或者数字只有20个，是不是因为样本数目太少，导致准确率太低？或者是其他原因

我想要达到的结果

提高识别率

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
万里鹏程转瞬至人工智能领域优质创作者 2022-09-09 09:23
关注
你的卷积池化堆叠太少了，导致全连接层参数巨多，而样本数不足所以loss很那下降。先尝试把模型的卷积池化多堆叠一些，然后重新训练试试看

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

手写字母识别项目求解答图像处理
2022-09-09 08:50

回答 1 已采纳你的卷积池化堆叠太少了，导致全连接层参数巨多，而样本数不足所以loss很那下降。先尝试把模型的卷积池化多堆叠一些，然后重新训练试试看
基于tensorflow的手写数字识别问题？？？
2017-08-15 09:01

回答 2 已采纳这个我之前搭过，，最好自己下载到本地，，然后修改加载的路径即可，，修改这里的路径即可： ``` mnist=input_data.read_data_sets(MNIST_dat
tensorflow2.0中文手写字识别，生成tfrecord文件每次都失败，求帮助 python 图像处理机器学习
2021-09-05 21:22

回答 1 已采纳首先说下你的cuda目测没有安装正确。其次，这行的代码是先验证你的命令行有无输入，如果没有输入就提示你输入类似的地址。而下面的else才是正确的地址。如果你不想通过命令行来执行，那么就将if el
基于matlab和opencv的手写数字及字母识别系统.rar
2022-01-19 15:57

基于matlab和opencv的手写数字及字母识别系统
svm识别手写数字优化 jupyter python 支持向量机
2021-12-23 08:07

回答 6 已采纳换一个模型就可以了 clf = svm.LinearSVC(max_iter=10000)
零基础做手写数字识别图像处理
2021-09-15 12:07

回答 1 已采纳 1.看一些神经网络相关的视频课程，比如吴恩达的相关视频。了解基本的卷积运算等等是怎么回事。2.配好python的环境，了解一下基本的语法（有过其它语言的基础不会很复杂的）。3.安装深度学习相关的库，建
多层感知机手写数字识别教学需要知道的参数有哪些？ python 人工智能有问必答
2021-12-09 12:32

回答 1 已采纳这个要理解多层感知机的一些常规参数，然后根据这些参数编写程序，这个还得要看多层感知机具体功能有哪些才能决定能实现什么功能
基于Elman神经网络的手写蒙文小写字母识别Matlab代码.7z
2020-06-22 11:20

研一做的课程设计，实现蒙文小写手写字母识别，MATLAB平台。附带操作图形界面。数据集为画板手写的300个，可替换别的数据集使用。
基于神经网络的手写数字识别如何将正确率提高到98%？人工智能机器学习神经网络
2022-12-08 22:53

回答 1 已采纳 # 导入 TensorFlow 库 import tensorflow as tf # 加载 MNIST 数据集 mnist = tf.keras.datasets.mnist # 划分为训练集和
手写数字识别，一共分为11类机器学习神经网络计算机视觉
2021-12-18 19:25

回答 1 已采纳首先训练集中要有「不是数字的图像」，然后输出层改一下就行
java基于感知机的手写体识别 java 有问必答
2021-12-07 15:37

回答 2 已采纳错误提示你了，文件没找到。allInput.txt这个文件是在当前类同目录下的吗？
matlab手写字母识别,一种基于MATLAB的手写字母的神经网络识别方法
2021-03-16 16:15

Ms.Bu的博客文章编号 :1009 - 671X(2001) 10 - 0028 - 03 一种基于 MATLAB 的手写字母的神经网络识别方法邓铭辉 ,孙枫 ,张志(哈尔滨工程大学自动化学院 ,黑龙江哈尔滨 150001) 摘要 :利用前向多层神经网络的反向传播算法 ...
深度学习入门实践的典型例题-手写数字识别 python
2023-03-15 17:57

回答 2 已采纳参考GPT和自己的思路：针对你提出的问题，我来逐一回答： AttributeError: module 'paddle.fluid.dygraph' has no attribute 'to_var
人工智能项目资料-基于卷积神经网络的4位字母数字混合的验证码识别（可以部分识别手写字体，需要手写字训练集）.zip
2024-02-02 12:40

【探索人工智能的宝藏之地】无论您是计算机相关专业的在校学生、老师，还是企业界的探索者，这个项目都是为您量身打造的。无论您是初入此领域的小白，还是寻求更高层次进阶的资深人士，这里都有您需要的宝藏。不仅...
从零开始pytorch手写字母识别
2021-12-10 15:30

zzu菜的博客 pytorch 深度学习机器学习手写字母识别
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月9日
展开全部

悬赏问题

¥15 linux驱动，linux应用，多线程
¥20 我要一个分身加定位两个功能的安卓app
¥15 基于FOC驱动器，如何实现卡丁车下坡无阻力的遛坡的效果
¥15 IAR程序莫名变量多重定义
¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助

手写字母识别项目求解答

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新