关于pytorch网站上官方实现fcn网络的问题

从b站一个up主那里copy的说是pytorch官网的FCN模型想要学习，但是有一些问题需要请教各位资深专家。

一丶整个项目要求是numpy==1.21.3 torch==1.10.0 torchvision==0.11.1，但是目前我已经下载不到低版本的torch模块了，所以请问高版本的兼容低版本的项目么？
二丶这个项目推荐使用官方的数据集“VOCtrainval_11-May-2012”，我将代码原封不动运行后出现了“AssertionError: path '/data/VOCdevkit\VOC2012' does not exist.”的错误，项目readme中也明确说明要更改根目录，但是我不知道怎么改，在代码中也没有找到所谓的“'--data-path'(VOC_root)”。

b站博主的视频说要在train.py靠后部分和my_dataset.py靠前部分中改东西，代码已经放在下面具体位置我已经用注释的方式标注，但是我不会改。

#train.py 训练模块
import os
import time
import datetime

import torch

from src import fcn_resnet50
from train_utils import train_one_epoch, evaluate, create_lr_scheduler
from my_dataset import VOCSegmentation
import transforms as T


class SegmentationPresetTrain:
    def __init__(self, base_size, crop_size, hflip_prob=0.5, mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)):
        min_size = int(0.5 * base_size)
        max_size = int(2.0 * base_size)

        trans = [T.RandomResize(min_size, max_size)]
        if hflip_prob > 0:
            trans.append(T.RandomHorizontalFlip(hflip_prob))
        trans.extend([
            T.RandomCrop(crop_size),
            T.ToTensor(),
            T.Normalize(mean=mean, std=std),
        ])
        self.transforms = T.Compose(trans)

    def __call__(self, img, target):
        return self.transforms(img, target)


class SegmentationPresetEval:
    def __init__(self, base_size, mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)):
        self.transforms = T.Compose([
            T.RandomResize(base_size, base_size),
            T.ToTensor(),
            T.Normalize(mean=mean, std=std),
        ])

    def __call__(self, img, target):
        return self.transforms(img, target)


def get_transform(train):
    base_size = 520
    crop_size = 480

    return SegmentationPresetTrain(base_size, crop_size) if train else SegmentationPresetEval(base_size)


def create_model(aux, num_classes, pretrain=True):
    model = fcn_resnet50(aux=aux, num_classes=num_classes)

    if pretrain:
        weights_dict = torch.load("./fcn_resnet50_coco.pth", map_location='cpu')

        if num_classes != 21:
            # 官方提供的预训练权重是21类(包括背景)
            # 如果训练自己的数据集，将和类别相关的权重删除，防止权重shape不一致报错
            for k in list(weights_dict.keys()):
                if "classifier.4" in k:
                    del weights_dict[k]

        missing_keys, unexpected_keys = model.load_state_dict(weights_dict, strict=False)
        if len(missing_keys) != 0 or len(unexpected_keys) != 0:
            print("missing_keys: ", missing_keys)
            print("unexpected_keys: ", unexpected_keys)

    return model


def main(args):
    device = torch.device(args.device if torch.cuda.is_available() else "cpu")
    batch_size = args.batch_size
    # segmentation nun_classes + background
    num_classes = args.num_classes + 1

    # 用来保存训练以及验证过程中信息
    results_file = "results{}.txt".format(datetime.datetime.now().strftime("%Y%m%d-%H%M%S"))

    # VOCdevkit -> VOC2012 -> ImageSets -> Segmentation -> train.txt
    train_dataset = VOCSegmentation(args.data_path,
                                    year="2012",
                                    transforms=get_transform(train=True),
                                    txt_name="train.txt")

    # VOCdevkit -> VOC2012 -> ImageSets -> Segmentation -> val.txt
    val_dataset = VOCSegmentation(args.data_path,
                                  year="2012",
                                  transforms=get_transform(train=False),
                                  txt_name="val.txt")

    num_workers = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])
    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size,
                                               num_workers=num_workers,
                                               shuffle=True,
                                               pin_memory=True,
                                               collate_fn=train_dataset.collate_fn)

    val_loader = torch.utils.data.DataLoader(val_dataset,
                                             batch_size=1,
                                             num_workers=num_workers,
                                             pin_memory=True,
                                             collate_fn=val_dataset.collate_fn)

    model = create_model(aux=args.aux, num_classes=num_classes)
    model.to(device)

    params_to_optimize = [
        {"params": [p for p in model.backbone.parameters() if p.requires_grad]},
        {"params": [p for p in model.classifier.parameters() if p.requires_grad]}
    ]

    if args.aux:
        params = [p for p in model.aux_classifier.parameters() if p.requires_grad]
        params_to_optimize.append({"params": params, "lr": args.lr * 10})

    optimizer = torch.optim.SGD(
        params_to_optimize,
        lr=args.lr, momentum=args.momentum, weight_decay=args.weight_decay
    )

    scaler = torch.cuda.amp.GradScaler() if args.amp else None

    # 创建学习率更新策略，这里是每个step更新一次(不是每个epoch)
    lr_scheduler = create_lr_scheduler(optimizer, len(train_loader), args.epochs, warmup=True)

    if args.resume:
        checkpoint = torch.load(args.resume, map_location='cpu')
        model.load_state_dict(checkpoint['model'])
        optimizer.load_state_dict(checkpoint['optimizer'])
        lr_scheduler.load_state_dict(checkpoint['lr_scheduler'])
        args.start_epoch = checkpoint['epoch'] + 1
        if args.amp:
            scaler.load_state_dict(checkpoint["scaler"])

    start_time = time.time()
    for epoch in range(args.start_epoch, args.epochs):
        mean_loss, lr = train_one_epoch(model, optimizer, train_loader, device, epoch,
                                        lr_scheduler=lr_scheduler, print_freq=args.print_freq, scaler=scaler)

        confmat = evaluate(model, val_loader, device=device, num_classes=num_classes)
        val_info = str(confmat)
        print(val_info)
        # write into txt
        with open(results_file, "a") as f:
            # 记录每个epoch对应的train_loss、lr以及验证集各指标
            train_info = f"[epoch: {epoch}]\n" \
                         f"train_loss: {mean_loss:.4f}\n" \
                         f"lr: {lr:.6f}\n"
            f.write(train_info + val_info + "\n\n")

        save_file = {"model": model.state_dict(),
                     "optimizer": optimizer.state_dict(),
                     "lr_scheduler": lr_scheduler.state_dict(),
                     "epoch": epoch,
                     "args": args}
        if args.amp:
            save_file["scaler"] = scaler.state_dict()
        torch.save(save_file, "save_weights/model_{}.pth".format(epoch))

    total_time = time.time() - start_time
    total_time_str = str(datetime.timedelta(seconds=int(total_time)))
    print("training time {}".format(total_time_str))


def parse_args():
    import argparse
    parser = argparse.ArgumentParser(description="pytorch fcn training")

    parser.add_argument("--data-path", default="/data/", help="VOCdevkit root")  #b站博主视频说是在这改但是我不知道怎么改。。。
    parser.add_argument("--num-classes", default=20, type=int)
    parser.add_argument("--aux", default=True, type=bool, help="auxilier loss")
    parser.add_argument("--device", default="cuda", help="training device")
    parser.add_argument("-b", "--batch-size", default=4, type=int)
    parser.add_argument("--epochs", default=30, type=int, metavar="N",
                        help="number of total epochs to train")

    parser.add_argument('--lr', default=0.0001, type=float, help='initial learning rate')
    parser.add_argument('--momentum', default=0.9, type=float, metavar='M',
                        help='momentum')
    parser.add_argument('--wd', '--weight-decay', default=1e-4, type=float,
                        metavar='W', help='weight decay (default: 1e-4)',
                        dest='weight_decay')
    parser.add_argument('--print-freq', default=10, type=int, help='print frequency')
    parser.add_argument('--resume', default='', help='resume from checkpoint')
    parser.add_argument('--start-epoch', default=0, type=int, metavar='N',
                        help='start epoch')
    # Mixed precision training parameters
    parser.add_argument("--amp", default=False, type=bool,
                        help="Use torch.cuda.amp for mixed precision training")

    args = parser.parse_args()

    return args


if __name__ == '__main__':
    args = parse_args()

    if not os.path.exists("./save_weights"):
        os.mkdir("./save_weights")

    main(args)



```__
```python
#my_dataset.py模块
import os

import torch.utils.data as data
from PIL import Image


class VOCSegmentation(data.Dataset):
    def __init__(self, voc_root, year="2012", transforms=None, txt_name: str = "train.txt"): #博主说是在这也要改“voc_root"的参数我也不会改。。。
        super(VOCSegmentation, self).__init__()
        assert year in ["2007", "2012"], "year must be in ['2007', '2012']"
        root = os.path.join(voc_root, "VOCdevkit", f"VOC{year}")
        assert os.path.exists(root), "path '{}' does not exist.".format(root)
        image_dir = os.path.join(root, 'JPEGImages')
        mask_dir = os.path.join(root, 'SegmentationClass')

        txt_path = os.path.join(root, "ImageSets", "Segmentation", txt_name)
        assert os.path.exists(txt_path), "file '{}' does not exist.".format(txt_path)
        with open(os.path.join(txt_path), "r") as f:
            file_names = [x.strip() for x in f.readlines() if len(x.strip()) > 0]

        self.images = [os.path.join(image_dir, x + ".jpg") for x in file_names]
        self.masks = [os.path.join(mask_dir, x + ".png") for x in file_names]
        assert (len(self.images) == len(self.masks))
        self.transforms = transforms

    def __getitem__(self, index):
        """
        Args:
            index (int): Index

        Returns:
            tuple: (image, target) where target is the image segmentation.
        """
        img = Image.open(self.images[index]).convert('RGB')
        target = Image.open(self.masks[index])

        if self.transforms is not None:
            img, target = self.transforms(img, target)

        return img, target

    def __len__(self):
        return len(self.images)

    @staticmethod
    def collate_fn(batch):
        images, targets = list(zip(*batch))
        batched_imgs = cat_list(images, fill_value=0)
        batched_targets = cat_list(targets, fill_value=255)
        return batched_imgs, batched_targets


def cat_list(images, fill_value=0):
    # 计算该batch数据中，channel, h, w的最大值
    max_size = tuple(max(s) for s in zip(*[img.shape for img in images]))
    batch_shape = (len(images),) + max_size
    batched_imgs = images[0].new(*batch_shape).fill_(fill_value)
    for img, pad_img in zip(images, batched_imgs):
        pad_img[..., :img.shape[-2], :img.shape[-1]].copy_(img)
    return batched_imgs


# dataset = VOCSegmentation(voc_root="/data/", transforms=get_transform(train=True))
# d1 = dataset[0]
# print(d1)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不会长胖的斜杠后端领域新星创作者 2022-04-11 11:28
关注
低版本可手动安装，是否兼容可自行尝试
path '/data/VOCdevkit\VOC2012' does not exist. 报错是文件位置不对，你已经找到在哪里改了，可将--data-path的default设置为文件绝对路径

一般复现代码主要是配置环境/更改路径，所以多看看报错的内容，试着了解代码

望采纳
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于pytorch网站上官方实现fcn网络的问题 pytorch 深度学习
2022-04-11 11:22

回答 1 已采纳低版本可手动安装，是否兼容可自行尝试 path '/data/VOCdevkit\VOC2012' does not exist. 报错是文件位置不对，你已经找到在哪里改了，可将--data-path
关于Pytorch中神经网络自定义的问题深度学习神经网络
2022-06-07 22:17

回答 2 已采纳替换成其他激活函数理论上是可以的，不过也有可能无法收敛，最好是高次的非线性函数，这样才好拟合 pytorch实现的话，参考李沐老师的系列教程应该就差不多了： 10 多层感
关于#深度学习#的问题：用adaboost或者xgboost算法把pytorch上的三个网络集成 pytorch 深度学习神经网络
2023-02-19 15:19

回答 1 已采纳对于集成多个PyTorch模型，可以使用以下步骤： 1.定义数据集并进行数据预处理。 2.分别定义和训练每个模型。可以使用不同的超参数和损失函数来训练每个模型以提高模型的多样性。 3.在每个模型上进行
FCN全卷积网络理解及代码实现（来自pytorch官方实现）
2022-06-14 22:42

是七叔呀的博客 FCN是首个端对端的针对像素级预测的全卷积网络而换为卷积层之后，最后得到的是1000通道的2D图像，可以可视化为heat map图。一般说的vgg16是D：全连接操作前后：77512（通道）【假设忽略偏置】\color{red}{【假设...
关于pytorch安装或pip更新的问题 pycharm python pytorch 有问必答
2022-04-11 14:57

回答 3 已采纳您好，可能是你pycharm中用的pio和您更新的pip不是一个pip,具体的可以私聊。
关于 pytorch中Tensor数据类型的使用问题 python 人工智能机器学习深度学习神经网络
2020-01-12 05:22

回答 1 已采纳 condi_inputs这个Tensor包含不止一个值，不能当作 bool值用于 if 语句，试试这样改动： ``` if condi_inputs is not None:
实现pytorch时出现空参数问题 pytorch 机器学习深度学习
2022-10-24 15:49

回答 1 已采纳 int是什么鬼？改成__init__，不然你都没有初始化model，导致你的model就是空的
pytorch实现FCN多分类
2023-01-10 11:06

靠谱电竞的博客在 PyTorch 中实现 FCN 的多分类模型，你需要先了解 FCN 的原理和如何在 PyTorch 中进行单分类。首先，你需要准备训练数据，包括输入图像和对应的标签。然后，定义 FCN 模型的网络结构，包括卷积层、池化层、全局...
关于pytorch无法识别cuda的问题 pytorch 深度学习
2022-01-28 09:48

回答 1 已采纳说几个思路吧：1.这是个人gpu还是公用，公用的话利用占显存的方式你不一定能读到这块gpu2.看看你的pytorch版本和cuda版本对应了嘛，不对应的话是用不了的3.重装cuda的时候，cudnn有
原形网络基于pytorch的实现 python pytorch
2023-03-22 13:23

回答 1 已采纳您可以按照以下步骤使用原形网络训练您自己的样本：将您的数据集转换为pytorch可以使用的数据格式，例如使用torchvision中的ImageFolder或Dataset类。请确保每个类别的样本数
关于pytorch中缺少next属性的报错 pytorch 深度学习神经网络
2022-11-04 09:00

回答 3 已采纳 next()函数实际上调用了传入函数的.__next()__成员函数。所以，如果传入的函数没有这个成员，则会报错参考代码理解 import torch # 生成一些测试数据 X = torch.nor
FCN实现语义分割-Pytorch（二）
2022-03-15 08:09

孙晓军82的博客 Pytorch提供了Dataset和Data Loader来帮助处理数据集。对于语义分割的训练数据，假设我们已经有了原始图像及对应的标签图像。为了训练网络模型，我们需要原始图像的Tensor数据，形状为（N，C, H, W）。其中N为样本...
关于装pytorch的问题！ pytorch
2022-10-29 18:06

回答 1 已采纳 csdn搜anaconda安装，还有pytorch安装，很详细的，每一步截图都用。配环境很折磨，折磨次数多了就好了
（17）语义分割（3）_pytorch用resnet50实现的FCN
2022-10-18 08:26

chencaw的博客 1、主要参考（1）博主的地址，推荐 Pytorch官方实现的FCN网络结构_哔哩哔哩_bilibili （2）博主的github GitHub - WZMIAOMIAO/deep-learning-for-image-processing: deep learning for image processing including ...
FCN实现语义分割-Pytorch（一）
2022-03-15 08:07

孙晓军82的博客 3、FCN实现语义分割 3.1、网络模型 3.1.1、模型初始化 3.1.2、权重初始化 3.1.3、前向计算 3.2、数据集（Dataset） 3.2.1、自定义Dataset 3.2.2、one-hot编码 3.2.3、数据预处理-数据变换（Transform） 3.2.4、数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日

悬赏问题

¥15 Centos7 / PETGEM
¥15 csmar数据进行spss描述性统计分析
¥15 各位请问平行检验趋势图这样要怎么调整？说标准差差异太大了
¥15 delphi webbrowser组件网页下拉菜单自动选择问题
¥15 wpf界面一直接收PLC给过来的信号，导致UI界面操作起来会卡顿
¥15 init i2c:2 freq:100000[MAIXPY]: find ov2640[MAIXPY]: find ov sensor是main文件哪里有问题吗
¥15 运动想象脑电信号数据集.vhdr
¥15 三因素重复测量数据R语句编写，不存在交互作用
¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗

关于pytorch网站上官方实现fcn网络的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新