训练模型时遇到以下问题：[WinError 10061] 由于目标计算机积极拒绝，无法连接

所有的数据集都在本地，不明白为什么会有连接问题

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

from findplate.config import opt
import os
import torch as t
from findplate import models
from findplate.data.dataset import MyDataset
from torch.utils.data import DataLoader
from torchnet import meter
from findplate.utils.visualize import Visualizer
from tqdm import tqdm
from torchvision import transforms as T

def write_csv(results,file_name,col1_name,col2_name):
import csv
with open(file_name,'w',newline='') as f:
writer = csv.writer(f)
writer.writerow([col1_name,col2_name])
writer.writerows(results)

def train(**kwargs):
opt._parse(kwargs)
vis = Visualizer(opt.env,port = opt.vis_port)

# step1: configure model
model = getattr(models, opt.model)()
if opt.load_model_path:
    model.load(opt.load_model_path)
model.to(opt.device)

# step2: data
train_data = MyDataset(opt.train_data_root,train=True)
val_data = MyDataset(opt.train_data_root,train=False)
train_dataloader = DataLoader(train_data,opt.batch_size,
                    shuffle=True,num_workers=opt.num_workers)
val_dataloader = DataLoader(val_data,opt.batch_size,
                    shuffle=False,num_workers=opt.num_workers)
# write id and classes into csv file
data_id_to_class = []
label_idx = 0
for label_name in train_data.data_classes:
    data_id_to_class.append([label_idx, label_name])
    label_idx += 1
print(data_id_to_class)
id_file_name = opt.id_file
write_csv(data_id_to_class,id_file_name,'label_idx','label_name')

# step3: criterion and optimizer
criterion = t.nn.CrossEntropyLoss()
lr = opt.lr
optimizer = model.get_optimizer(lr, opt.weight_decay)
    
# step4: meters
loss_meter = meter.AverageValueMeter()
confusion_matrix = meter.ConfusionMeter(opt.classifier_num)
previous_loss = 1e10

# train
for epoch in range(opt.max_epoch):
    
    loss_meter.reset()
    confusion_matrix.reset()

    for ii,(data,label) in tqdm(enumerate(train_dataloader)):

        # train model 
        input = data.to(opt.device)
        target = label.to(opt.device)


        optimizer.zero_grad()
        score = model(input)
        loss = criterion(score,target)
        loss.backward()
        optimizer.step()
        
        
        # meters update and visualize
        loss_meter.add(loss.item())
        # detach 一下更安全保险
        confusion_matrix.add(score.detach(), target.detach()) 

        if (ii + 1)%opt.print_freq == 0:
            vis.plot('loss', loss_meter.value()[0])
            
            # 进入debug模式
            if os.path.exists(opt.debug_file):
                import ipdb;
                ipdb.set_trace()


    model.save()

    # validate and visualize
    val_cm,val_accuracy = val(model,val_dataloader)

    vis.plot('val_accuracy',val_accuracy)
    vis.log("epoch:{epoch},lr:{lr},loss:{loss},train_cm:{train_cm},val_cm:{val_cm}".format(
                epoch = epoch,loss = loss_meter.value()[0],val_cm = str(val_cm.value()),train_cm=str(confusion_matrix.value()),lr=lr))
    
    # update learning rate
    if loss_meter.value()[0] > previous_loss:          
        lr = lr * opt.lr_decay
        # 第二种降低学习率的方法:不会有moment等信息的丢失
        for param_group in optimizer.param_groups:
            param_group['lr'] = lr
    

    previous_loss = loss_meter.value()[0]

@t.no_grad()
def val(model,dataloader):
"""
计算模型在验证集上的准确率等信息
"""
model = model.eval()

confusion_matrix = meter.ConfusionMeter(opt.classifier_num)
for ii, (val_input, label) in tqdm(enumerate(dataloader)):
    val_input = val_input.to(opt.device)
    score = model(val_input)
    confusion_matrix.add(score.detach().squeeze(), label.type(t.LongTensor))

model.train()
cm_value = confusion_matrix.value()
cm_value_sum = 0
for i in range(opt.classifier_num):
    cm_value_sum += cm_value[i][i]
accuracy = 100. * (cm_value_sum) / (cm_value.sum())
return confusion_matrix, accuracy

def help():
"""
打印帮助的信息： python file.py help
"""

print("""
usage : python file.py <function> [--args=value]
<function> := train | test | help
example: 
        python {0} train --env='env0701' --lr=0.01
        python {0} test --dataset='path/to/dataset/root/'
        python {0} help
avaiable args:""".format(__file__))

from inspect import getsource
source = (getsource(opt.__class__))
print(source)

if name=='main':
import fire
fire.Fire()

以下是配置信息：

class DefaultConfig(object):
env = 'default' # visdom 环境
vis_port =8097 # visdom 端口
model = 'SqueezeNet' # 使用的模型，名字必须与models/init.py中的名字一致
classifier_num = 2 # 分类器最终的分类数量
gray = False # 读取图片是否为灰度图

train_data_root = './imgs/images/cnn_plate_train/'  # 训练集存放路径
test_data_root = './data/test/plate/'  # 测试集存放路径
load_model_path = None  # 加载预训练的模型的路径，为None代表不加载

batch_size = 16  # batch size
use_gpu = True  # user GPU or not
num_workers = 0  # how many workers for loading data
print_freq = 20  # print info every N batch

debug_file = '/tmp/debug'  # if os.path.exists(debug_file): enter ipdb
result_file = 'result.csv'
id_file = './findplate/plate.csv'

max_epoch = 100
lr = 0.001  # initial learning rate
lr_decay = 0.5  # when val_loss increase, lr = lr*lr_decay
weight_decay = 0e-5  # 损失函数

opt = DefaultConfig()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不会长胖的斜杠新星创作者: 后端开发技术领域 2022-05-12 16:28
关注
这种一般都是在本地训练，然后是在web中给你可视化操作的，我也踩过坑，你开启visdom.sevser了吗？
https://blog.csdn.net/Dummy_/article/details/106873857

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

【Python】Visdom：ConnectionRefusedError: [WinError 10061] 由于目标计算机积极拒绝，无法连接。
2024-12-25 10:11

HEX9CF的博客 Visdom 是 Facebook AI Research (FAIR) 开发的一个可视化工具，用于实时可视化数据。它特别适用于机器学习实验，允许用户创建、组织和共享数据和模型的可视化。的Visdom服务器，但连接被拒绝。因为Visdom服务器没有...
一种解决python深度学习中“由于目标计算机积极拒绝，无法连接”问题的方法
2024-05-23 12:38

Co1rbin的博客解决了python没有连接visdom server问题
跑模型时出现“OSError: [WinError 1455] 页面文件太小，无法完成操作.....“问题
2024-08-25 16:45

李歪歪歪歪的博客在对 ultralytics 的YOLOv8模型进行训练时出现了"OSError: [WinError 1455] 页面文件太小，无法完成操作…"问题，导致模型训练失败，然后尝试了三种解决方法最终解决了。
【问题记录与解决】TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。
2022-12-24 19:54

追光者♂的博客【问题记录与解决】TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。| 人工智能 面试题：请介绍一下卷积神经网络（CNN）中的残差连接（Residual Connection...
【问题记录与解决】OSError: [WinError 127] 找不到指定的程序。| 人工智能 面试题：什么是深度生成模型（Deep Generative Models）？列举一些常用的深度生成模型
2022-12-24 19:34

追光者♂的博客【问题记录与解决】OSError: [WinError 127] 找不到指定的程序。人工智能 面试题：什么是深度生成模型（Deep Generative Models）？列举一些常用的深度生成模型。
解决YOLO报错：OSError: [WinError 1455] 页面文件太小，无法完成操作
2024-10-13 11:12

FriendshipT的博客解决YOLO报错：OSError: [WinError 1455] 页面文件太小，无法完成操作前言前提条件实验环境报错如下分析原因一、workers参数的定义与作用二、workers参数的设置建议三、workers与batch-size的关系四、实践...
【跟我学YOLO】（2）在个人数据集上训练 YOLO11 模型
2025-02-19 13:27

youcans的博客本节介绍用本地数据集训练 YOLO11 模型，建立特定任务的私有模型。一步步详细介绍数据集的下载和准备，模型配置，模型训练、验证和预测。
YOLO系列——[WinError 1455] 页面文件太小，无法完成操作
2021-10-21 15:31

Star星屹程序设计的博客最近在用yolo系列训练自己的数据，但是在调参数时，batch_size稍微网上调整点就会出错（比如：4,8等），报错信息如下：提示页面文件太小 [WinError 1455] 页面文件太小，无法完成操作。 Error loading "D:\...
YOLOV7 目标检测模型调试记录
2022-12-13 22:37

彭祥.的博客 YOLO系列在目标检测领域可谓名声赫赫，其性能表现不俗，如今其已经更新到了YOLOV7版本，今天便来一睹其风采。博主之前只是对YOLO算法的原理一知半解，并未实验，因此并不熟练，因此，借此机会来进行实验以为日后的...
基于yolov5的目标检测和模型训练（Miniconda3+PyTorch+Pycharm+实战项目——装甲板识别）
2022-01-09 00:36

Quinton123的博客目录一、环境配置和源码获取 1.Miniconda 2.MIniconda虚拟环境配置PyTorch 3.yolov5项目源码 4.pycharm 二、目标检测三、模型训练 1.数据集 1.images 2.labels 2.yaml文件 3.预训练权重模型文件 4.train.py 1....
通过google drive下载模型权重出现错误Failed to establish[Errno 101] Network new connection:is unreachable
2024-10-08 09:43

靜之契約者的博客上传到代码所指向的目标路径，并根据路径将压缩包重命名...猜测应该是网络问题，连接外网下载模型权重时无法连接。在本地下载压缩包得到natural.pt.tar。跑深度学习模型实验到这一步时出现错误。拼接起来的完整链接为。
win10安装yolox，训练自定义模型，使用tensorrt部署全流程
2022-09-01 16:32

盛世芳华的博客 win10安装yolox，训练自定义模型，使用tensorrt部署全流程
关于人工智能yolov5的训练，识别，模型转换相关的帮助文件——简单易懂还算详细
2022-05-06 21:45

想当程序猿的凯旋大大的博客 yolov5的训练和移植android的方法总结
yolov7目标追踪：基于自定义数据集完成检测
2023-04-05 23:16

胖墩会武术的博客目标追踪包含两个阶段：（1）基于自定义数据集，训练yolo目标检测模型；（2）基于检测模型，将实时检测结果传递到StrongSORT追踪算法中，该算法在OSNet基础上结合运动和外观信息，可以跟踪yolo模型检测到的任何物体...
全网最详细教程，手把书教你使用YOLOv10训练自己的数据集和推理(附YOLOv10网络结构图)
2024-08-20 11:35

落花不写码的博客 YOLOv10，由清华大学多媒体智能组只开发，是一款亳秒级实时端到端目标检测的开源模型。该模型在保持性能不变的情况下，与YOLOv9相比，延迟减少了46%，参数减少了25%，非常适合需要快速检测物体的应用，如实时视频...
YOLOv8分类模型实战：从数据整理到模型部署全流程（附完整代码）
2025-12-12 14:00

断眉的派大星的博客主要内容包括：YOLOv8分类模型的优势（极简API、速度快、生态统一）、环境搭建指南、数据集的ImageNet格式要求及自动整理脚本、模型训练的核心代码与参数配置。文章以花卉分类为例，从数据准备到模型部署提供完整...
yolov5 从配置环境到自己训练数据集合
2022-12-23 19:21

Macre Aegir Thrym的博客例如你的web工程为一个环境，人工智能为一个环境，数据可视化一个环境。 create是创建新的环境。 2、利用Anaconda Promp创建新环境通常一个环境就足够了，但是我还是建议再创建一个新的环境。在有些情况下，你可以...
目标检测 YOLOv5-7.0 详细调试&自制数据集实战
2024-07-26 00:47

wanchen_Gabby的博客 7.0项目介绍及环境配置（项目解读、版本选择、环境配置）、如何利用YOLOv5进行预测（detect.py）（main函数中参数的解读、解决问题的小技巧）、如何训练YOLOv5神经网络（train.py）（本地上训练、main函数中参数的...
YOLOv5配置问题总结（含大量避坑指南）
2022-05-03 17:21

大仙的bug日志的博客目录前言问题1-YOLOv5运行环境——pycocotools ＞= 2.0 安装...问题4-[WinError 1455] 页面文件太小，无法完成操作问题5-AssertionError: Image Not Found D:\PycharmProjects\yolov5-hat\VOCdevkit\images\tr
【纯干货级教程】解决RuntimeError:CUDA out of memory
2024-05-13 13:23

拿下Nahida的博客本文对于采用CPU/LAPTOP-GPU如何加快训练进程，会有较为明确的描述和解决方法，如果目前你存在设备算力差等类似情况的话，相信参考本文的步骤进行尝试是能够解决的。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月12日

训练模型时遇到以下问题：[WinError 10061] 由于目标计算机积极拒绝，无法连接

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

3条回答 默认 最新

问题事件

3条回答默认最新