alexnet训练自己的数据集通道数报错

alexnet预训练结束，训练自己的数据集，通道报错

Traceback (most recent call last):
  File "E:\data\aasuceessful\train.py", line 132, in <module>
    main()
  File "E:\data\aasuceessful\train.py", line 93, in main
    outputs = alexnet(images.to(device))
……

RuntimeError: Given groups=1, weight of size [64, 1, 11, 11], expected input[3, 3, 224, 224] to have 1 channels, but got 3 channels instead

代码如下，预训练模型通道数已改为1

import os
import sys
import json

import torch
import torch.nn as nn
from torchvision import transforms, datasets, utils
import matplotlib.pyplot as plt
import numpy as np
import torch.optim as optim
from tqdm import tqdm

from premodel import BuildAlexNet


def main():
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("using {} device.".format(device))

    data_transform = {
        "train": transforms.Compose([transforms.RandomResizedCrop(224),
                                     transforms.RandomHorizontalFlip(),
                                     transforms.ToTensor(),
                                     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]),
        "val": transforms.Compose([transforms.Resize((224, 224)),  # cannot 224, must (224, 224)
                                   transforms.ToTensor(),
                                   transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])}

    data_root = os.path.abspath(os.path.join(os.getcwd(), "../.."))  # get data root path
    image_path = os.path.join(data_root, r"C:\Users\ASUS\Desktop\L", "split")  # flower data set path
    assert os.path.exists(image_path), "{} path does not exist.".format(image_path)
    train_dataset = datasets.ImageFolder(root=os.path.join(image_path, "train"),
                                         transform=data_transform["train"])
    train_num = len(train_dataset)

    # {    "0": "benign","1": "malignant"}
    split_list = train_dataset.class_to_idx
    cla_dict = dict((val, key) for key, val in split_list.items())
    # write dict into json file
    json_str = json.dumps(cla_dict, indent=4)
    with open('class_indices.json', 'w') as json_file:
        json_file.write(json_str)

    batch_size = 3
    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])  # number of workers
    print('Using {} dataloader workers every process'.format(nw))

    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size, shuffle=True,
                                               num_workers=nw)

    validate_dataset = datasets.ImageFolder(root=os.path.join(image_path, "val"),
                                            transform=data_transform["val"])
    val_num = len(validate_dataset)
    validate_loader = torch.utils.data.DataLoader(validate_dataset,
                                                  batch_size=3, shuffle=False,
                                                  num_workers=nw)

    print("using {} images for training, {} images for validation.".format(train_num,
                                                                           val_num))
    # test_data_iter = iter(validate_loader)
    # test_image, test_label = test_data_iter.next()
    #
    # def imshow(img):
    #     img = img / 2 + 0.5  # unnormalize
    #     npimg = img.numpy()
    #     plt.imshow(np.transpose(npimg, (1, 2, 0)))
    #     plt.show()
    #
    # print(' '.join('%5s' % cla_dict[test_label[j].item()] for j in range(4)))
    # imshow(utils.make_grid(test_image))

    #alexnet = BuildAlexNet(model_type='new',n_output=2)


    alexnet.to(device)
    loss_function = nn.CrossEntropyLoss()
    # pata = list(net.parameters())
    optimizer = optim.Adam(alexnet.parameters(), lr=0.0002)

    epochs = 10
    save_path = './AlexNet.pth'
    best_acc = 0.0
    train_steps = len(train_loader)
    for epoch in range(epochs):
        # train
        alexnet.train()
        running_loss = 0.0
        train_bar = tqdm(train_loader, file=sys.stdout)
        for step, data in enumerate(train_bar):
            images, labels = data
            optimizer.zero_grad()
            outputs = alexnet(images.to(device))
            loss = loss_function(outputs, labels.to(device))
            loss.backward()
            optimizer.step()

            # print statistics
            running_loss += loss.item()

            train_bar.desc = "train epoch[{}/{}] loss:{:.3f}".format(epoch + 1,
                                                                     epochs,
                                                                     loss)

        # validate
        alexnet.eval()
        acc = 0.0  # accumulate accurate number / epoch
        with torch.no_grad():
            val_bar = tqdm(validate_loader, file=sys.stdout)
            for val_data in val_bar:
                val_images, val_labels = val_data
                outputs = alexnet(val_images.to(device))
                predict_y = torch.max(outputs, dim=1)[1]
                acc += torch.eq(predict_y, val_labels.to(device)).sum().item()

        val_accurate = acc / val_num
        print('[epoch %d] train_loss: %.3f  val_accuracy: %.3f' %
              (epoch + 1, running_loss / train_steps, val_accurate))

        if val_accurate > best_acc:
            best_acc = val_accurate
            torch.save(alexnet.state_dict(), save_path)

    print('Finished Training')


if __name__ == '__main__':
    model_type = 'new'
    n_output = 2
    alexnet = BuildAlexNet(model_type, n_output)  # 调用函数buildAlexnet，网络选项是预训练模型，输出是2，也就是分两类
    print(alexnet)
    main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
m0_58447185 2023-03-16 17:05
关注
将两个compose改为下面代码

transforms.Grayscale(1), transforms.ToTensor(), transforms.Normalize((0.5, ), (0.5, ))
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

alexnet训练自己的数据集通道数报错 python pytorch 深度学习
2023-03-15 20:40

回答 2 已采纳将两个compose改为下面代码 transforms.Grayscale(1), transforms.ToTensor(), transforms.Normalize((0.5, ), (0.5,
训练AlexNet模型到一半时报错 python tensorflow
2022-12-24 08:57

回答 3 已采纳已解决，参考：http://t.csdn.cn/kSBa1可能是批量下载时出的问题，检查出错误图片并删除就行。（错误图片在电脑里可以正常打开查看，所以需要用代码检查）
如何将三通道改为一通道 python pytorch 机器学习
2023-03-14 21:53

回答 3 已采纳若要将AlexNet的三通道调整为一通道，可以在模型定义时修改第一层卷积层的输入通道数。具体地，在BuildAlexNet类中，找到self.features，即AlexNet的特征提取部分，将其中的
人工智能学习07--pytorch12--AlexNet+花数据集+pytorch
2023-03-21 20:37

小金金金金鱼的博客 validate main predict 遇到了这个问题： RuntimeError: The size of tensor a (4) must match the size of tensor b (3) at non-singleton dimension 0 使用自己的数据集训练网络修改网络参数 train： predict：
AlexNet神经网络中卷积层的问题神经网络
2016-11-20 12:23

回答 2 已采纳 https://www.zhihu.com/question/39022858
InvalidArgumentError: Failed to create a directory: log/C:; Invalid argument这是什么原因呀 tensorflow 人工智能机器学习深度学习神经网络
2019-08-26 01:11

回答 1 已采纳 # 采纳率太差，如果希望得到更多帮助，请及时采纳 log路径的输出为止，不要写 c:\，因为是相对路径，而冒号是不允许的。
Perfect Pth Powers
2017-09-08 03:10

回答 1 已采纳 http://blog.csdn.net/lianai911/article/details/39494291
ubuntu18.04配置caffe+批量训练自己的数据集(超详细)
2022-05-08 22:15

甩甩teng的博客 ubuntu18.04配置caffe+批量训练自己的数据集(超详细)
Opencv调用tensorflow训练自己的数据集生成的Alex模型
2020-08-17 11:10

Hello AI！的博客 Opencv调用tensorflow训练自己的数据集生成的Alex模型要实现opencv调用tensorflow训练的模型，主要分为两步，第一步是训练模型，将模型保存成model.pb格式，然后利用opencv的readNetFromTensorflow方法调用model.pb...
MATLAB | 使用FasterRcnn实现目标检测（自己创建数据集）
2022-04-01 23:01

编程日记✧的博客基于MATLAB使用FasterRcnn实现目标检测（自己创建数据集）。使用MATLAB R2018a中的traininglmageLabeler工具对图片进行标注，将标注的结果保存为.mat文件。网络生成与测试，设置网络参数，包括随机梯度下降(SGDM)...
关于数据集和模型的一些笔记
2020-04-01 16:54

Zerg Wang的博客常用数据集简介 CIFAR（Canadian Institute For Advanced Research） ... CIFAR10：分类数据集，10类，每类6000张，...CIFAR100：分类数据集，20个大类，每个大类下有5小类，共100类，每类600张（其中，训练用数据...
华为ModelArts训练Alexnet模型
2022-06-26 22:00

花花少年的博客 ModelArts Web训练Alexnet模型
pytorch预训练模型加载与使用(以AlexNet为例)
2021-08-17 17:14

AI AX AT的博客代码讲解2.1 加载必要的包2.2 设置GPU和transform2.3 数据预处理2.4 引入模型2.5 训练模型2.6 测试模型2.7 保存模型3. 完整代码本文主要是提供过程，不要在意结果。 1. 概况 pytorch 中有许多已经训练好的模型提供...
深度学习入门（六）图像分类数据集（MNIST）
2022-10-25 15:10

澪mio的博客图像分类数据集（Fashion-MNIST） 1 获取数据集 2 读取小批量 3 整合所有组件
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月15日
展开全部

悬赏问题

¥120 计算机网络的新校区组网设计
¥20 完全没有学习过GAN，看了CSDN的一篇文章，里面有代码但是完全不知道如何操作
¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
¥20 海浪数据南海地区海况数据，波浪数据
¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等
¥15 matlab 用yalmip搭建模型，cplex求解，线性化处理的方法
¥15 qt6.6.3 基于百度云的语音识别不会改
¥15 关于#目标检测#的问题：大概就是类似后台自动检测某下架商品的库存，在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
¥15 神经网络怎么把隐含层变量融合到损失函数中？

alexnet训练自己的数据集通道数报错

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新