alexnet训练自己的数据集通道数报错

alexnet预训练结束，训练自己的数据集，通道报错

Traceback (most recent call last):
  File "E:\data\aasuceessful\train.py", line 132, in <module>
    main()
  File "E:\data\aasuceessful\train.py", line 93, in main
    outputs = alexnet(images.to(device))
……

RuntimeError: Given groups=1, weight of size [64, 1, 11, 11], expected input[3, 3, 224, 224] to have 1 channels, but got 3 channels instead

代码如下，预训练模型通道数已改为1

import os
import sys
import json

import torch
import torch.nn as nn
from torchvision import transforms, datasets, utils
import matplotlib.pyplot as plt
import numpy as np
import torch.optim as optim
from tqdm import tqdm

from premodel import BuildAlexNet


def main():
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("using {} device.".format(device))

    data_transform = {
        "train": transforms.Compose([transforms.RandomResizedCrop(224),
                                     transforms.RandomHorizontalFlip(),
                                     transforms.ToTensor(),
                                     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]),
        "val": transforms.Compose([transforms.Resize((224, 224)),  # cannot 224, must (224, 224)
                                   transforms.ToTensor(),
                                   transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])}

    data_root = os.path.abspath(os.path.join(os.getcwd(), "../.."))  # get data root path
    image_path = os.path.join(data_root, r"C:\Users\ASUS\Desktop\L", "split")  # flower data set path
    assert os.path.exists(image_path), "{} path does not exist.".format(image_path)
    train_dataset = datasets.ImageFolder(root=os.path.join(image_path, "train"),
                                         transform=data_transform["train"])
    train_num = len(train_dataset)

    # {    "0": "benign","1": "malignant"}
    split_list = train_dataset.class_to_idx
    cla_dict = dict((val, key) for key, val in split_list.items())
    # write dict into json file
    json_str = json.dumps(cla_dict, indent=4)
    with open('class_indices.json', 'w') as json_file:
        json_file.write(json_str)

    batch_size = 3
    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])  # number of workers
    print('Using {} dataloader workers every process'.format(nw))

    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size, shuffle=True,
                                               num_workers=nw)

    validate_dataset = datasets.ImageFolder(root=os.path.join(image_path, "val"),
                                            transform=data_transform["val"])
    val_num = len(validate_dataset)
    validate_loader = torch.utils.data.DataLoader(validate_dataset,
                                                  batch_size=3, shuffle=False,
                                                  num_workers=nw)

    print("using {} images for training, {} images for validation.".format(train_num,
                                                                           val_num))
    # test_data_iter = iter(validate_loader)
    # test_image, test_label = test_data_iter.next()
    #
    # def imshow(img):
    #     img = img / 2 + 0.5  # unnormalize
    #     npimg = img.numpy()
    #     plt.imshow(np.transpose(npimg, (1, 2, 0)))
    #     plt.show()
    #
    # print(' '.join('%5s' % cla_dict[test_label[j].item()] for j in range(4)))
    # imshow(utils.make_grid(test_image))

    #alexnet = BuildAlexNet(model_type='new',n_output=2)


    alexnet.to(device)
    loss_function = nn.CrossEntropyLoss()
    # pata = list(net.parameters())
    optimizer = optim.Adam(alexnet.parameters(), lr=0.0002)

    epochs = 10
    save_path = './AlexNet.pth'
    best_acc = 0.0
    train_steps = len(train_loader)
    for epoch in range(epochs):
        # train
        alexnet.train()
        running_loss = 0.0
        train_bar = tqdm(train_loader, file=sys.stdout)
        for step, data in enumerate(train_bar):
            images, labels = data
            optimizer.zero_grad()
            outputs = alexnet(images.to(device))
            loss = loss_function(outputs, labels.to(device))
            loss.backward()
            optimizer.step()

            # print statistics
            running_loss += loss.item()

            train_bar.desc = "train epoch[{}/{}] loss:{:.3f}".format(epoch + 1,
                                                                     epochs,
                                                                     loss)

        # validate
        alexnet.eval()
        acc = 0.0  # accumulate accurate number / epoch
        with torch.no_grad():
            val_bar = tqdm(validate_loader, file=sys.stdout)
            for val_data in val_bar:
                val_images, val_labels = val_data
                outputs = alexnet(val_images.to(device))
                predict_y = torch.max(outputs, dim=1)[1]
                acc += torch.eq(predict_y, val_labels.to(device)).sum().item()

        val_accurate = acc / val_num
        print('[epoch %d] train_loss: %.3f  val_accuracy: %.3f' %
              (epoch + 1, running_loss / train_steps, val_accurate))

        if val_accurate > best_acc:
            best_acc = val_accurate
            torch.save(alexnet.state_dict(), save_path)

    print('Finished Training')


if __name__ == '__main__':
    model_type = 'new'
    n_output = 2
    alexnet = BuildAlexNet(model_type, n_output)  # 调用函数buildAlexnet，网络选项是预训练模型，输出是2，也就是分两类
    print(alexnet)
    main()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
m0_58447185 2023-03-16 17:05
关注
将两个compose改为下面代码

transforms.Grayscale(1), transforms.ToTensor(), transforms.Normalize((0.5, ), (0.5, ))
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

人工智能学习07--pytorch12--AlexNet+花数据集+pytorch
2023-03-21 20:37

小金金金金鱼的博客 validate main predict 遇到了这个问题： RuntimeError: The size of tensor a (4) must match the size of tensor b (3) at non-singleton dimension 0 使用自己的数据集训练网络修改网络参数 train： predict：
ScanNet数据集详解
2025-07-11 15:23

frostmelody的博客 ScanNet 是一个 RGB-D 视频数据集，在超过 1500 次扫描中包含了 250 万个视图，并标注了 3D 相机位姿、表面重建和实例级的语义分割。为了收集这些数据，设计了一个易于使用且具有扩展性的 RGB-D 捕获系统，包括自动...
ubuntu18.04配置caffe+批量训练自己的数据集(超详细)
2022-05-08 22:15

甩甩teng的博客 ubuntu18.04配置caffe+批量训练自己的数据集(超详细)
Opencv调用tensorflow训练自己的数据集生成的Alex模型
2020-08-17 11:10

Hello AI！的博客 Opencv调用tensorflow训练自己的数据集生成的Alex模型要实现opencv调用tensorflow训练的模型，主要分为两步，第一步是训练模型，将模型保存成model.pb格式，然后利用opencv的readNetFromTensorflow方法调用model.pb...
MATLAB | 使用FasterRcnn实现目标检测（自己创建数据集）
2022-04-01 23:01

编程日记✧的博客基于MATLAB使用FasterRcnn实现目标检测（自己创建数据集）。使用MATLAB R2018a中的traininglmageLabeler工具对图片进行标注，将标注的结果保存为.mat文件。网络生成与测试，设置网络参数，包括随机梯度下降(SGDM)...
RK3566 RK3568 RK3588 使用RKNN NPU进行推理系列（三），训练自己的数据集并转成rknn
2025-06-07 16:28

这个Bug不难的博客 RK3566 RK3568 RK3588 使用RKNN NPU进行推理训练自己的数据 rk3576 pytorch
关于数据集和模型的一些笔记
2020-04-01 16:54

Zerg Wang的博客常用数据集简介 CIFAR（Canadian Institute For Advanced Research） ... CIFAR10：分类数据集，10类，每类6000张，...CIFAR100：分类数据集，20个大类，每个大类下有5小类，共100类，每类600张（其中，训练用数据...
005 深度学习（图像分类）——AlexNet网络结构详解与花分类数据集
2025-07-23 13:46

FAcolTY的博客 AlexNet是2012年ISLVRC 2012(imageNet Large Scale Visual Recognition Challenge)竞赛的冠军网络，分类准确率由传统的70%+提升到80%+。它是由Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后，深度学习开始...
AlexNet项目图片分类通用模型代码
2024-09-19 21:16

Mr终游的博客 torch.utils.data.DataLoader：读取数据：参数(dataset：数据加载的数据集，batch_size：每次加载多少样本数，suffle：是否打乱数据，num_workers：最多并行加载数量)Dropout：将比例数据置空，比如数据为（1，2，3...
华为ModelArts训练Alexnet模型
2022-06-26 22:00

花花少年的博客 ModelArts Web训练Alexnet模型
【AlexNet论文精读以及代码复现以及训练结果（猫狗识别）】
2023-07-26 16:12

每日一道力扣的博客 AlexNet论文精读和代码复现以及训练结果
【深度学习】手撕 CNN 之 AlexNet（PyTorch 实战篇）
2022-03-27 12:00

风度78的博客 1.数据集制作在论文中AlexNet作者使用的是ILSVRC 2012比赛数据集，该数据集非常大（有138G），下载、训练都很消耗时间，我们在复现的时候就不用这个数据集了。由于MNIST、CIFAR10、CIFAR100这些数据集图片尺...
pytorch预训练模型加载与使用(以AlexNet为例)
2021-08-17 17:14

AI AX AT的博客代码讲解2.1 加载必要的包2.2 设置GPU和transform2.3 数据预处理2.4 引入模型2.5 训练模型2.6 测试模型2.7 保存模型3. 完整代码本文主要是提供过程，不要在意结果。 1. 概况 pytorch 中有许多已经训练好的模型提供...
深度学习入门（六）图像分类数据集（MNIST）
2022-10-25 15:10

澪mio的博客图像分类数据集（Fashion-MNIST） 1 获取数据集 2 读取小批量 3 整合所有组件
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月15日
展开全部

alexnet训练自己的数据集通道数报错

2条回答 默认 最新

问题事件

2条回答默认最新