在yolov3下训练自己的数据集卡住

我在进行voc数据集的训练，使用yolov3
并根据这个流程
https://blog.csdn.net/weixin_43818251/article/details/89548583

darknet训练卡住
我使用命令
./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74 >> /home/heying/darknet/scripts/VOCdevkit/VOC2020/traffic_light.log

就是这个终端一直是这样的，这正常吗

问题相关代码

显卡

使用的cfg/voc.data文件

classes= 3
train  = /home/heying/darknet/scripts/2020_train.txt
valid  = /home/heying/darknet/scripts/2020_test.txt
names = data/voc2020.names
backup = /home/pjreddie/backup/

使用的cfg/yolov3-voc.cfg文件

[net]
# Testing
 batch=1
 subdivisions=1
# Training        #训练模式 每次前向图片的数目=batch/subdivisions


#关于batch与subdivision：在训练输出中，训练迭代包括8组，
#这些batch样本又被平均分成subdivision=8次送入网络参与训练，
#以减轻内存占用的压力；batch越大，训练效果越好，subdivision越大，占用内存压力越小
# batch=64
# subdivisions=16


#网络输入的宽、高、通道数这三个参数中，要求width==height, 并且为32的倍数
#大分辨率可以检测到更加细小的物体，从而影响precision
width=416        #只能是32的倍数
height=416
channels=3
momentum=0.9        #动量，影响梯度下降到最优的速度，一般默认0.9
decay=0.0005        #权重衰减正则系数，防止过拟合
angle=0            #旋转角度，从而生成更多训练样本
saturation = 1.5    #调整饱和度，从而生成更多训练样本
exposure = 1.5        #调整曝光度，从而生成更多训练样本
hue=.1            #调整色调，从而生成更多训练样本


#学习率决定了权值更新的速度，学习率大，更新的就快，但太快容易越过最优值，
#而学习率太小又更新的慢，效率低，一般学习率随着训练的进行不断更改，
#先高一点，然后慢慢降低，一般在0.01--0.001
learning_rate=0.001


#学习率控制的参数，在迭代次数小于burn_in时，其学习率的更新有一种方式，大于burn_in时，才采用policy的更新方式
burn_in=1000


#迭代次数，1000次以内，每训练100次保存一次权重，1000次以上，每训练10000次保存一次权重
max_batches = 50200
policy=steps        # 学习率策略，学习率下降的方式
steps=40000,45000    #学习率变动步长

#学习率变动因子：如迭代到40000次时，学习率衰减十倍，45000次迭代时，学习率又会在前一个学习率的基础上衰减十倍
scales=.1,.1



[convolutional]
batch_normalize=1    #BN
filters=32        #卷积核数目
size=3            #卷积核尺寸
stride=1        #做卷积运算的步长


#如果pad为0,padding由 padding参数指定；
#如果pad为1，padding大小为size/2，
#padding应该是对输入图像左边缘拓展的像素数量
pad=1
activation=leaky    #激活函数类型

# Downsample
【后面的没有修改】

在卡住的过程中的log文件

 CUDNN_HALF=1
0,1
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0
 CUDNN_HALF=1
0,1
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0

 seen 64, trained: 0 K-images (0 Kilo-batches_64)
CUDA status Error: file: ./src/dark_cuda.c : () : line: 38 : build time: Mar  7 2022 - 16:11:01

 CUDA Error: invalid device ordinal
 CUDNN_HALF=1
0
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0
 CUDNN_HALF=1
0
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0
 CUDNN_HALF=1
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0
 CUDNN_HALF=1
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0
 CUDNN_HALF=1
yolov3-voc
net.optimized_memory = 0
mini_batch = 1, batch = 1, time_steps = 1, train = 1
Create CUDA-stream - 0
 Create cudnn-handle 0

我的解答思路和尝试过的方法

权重文件换成了yolov3.weights也还是卡住

说明

使用的voc数据集在我的另一台nvidia AGX 中jetson-inference里训练是正常的，出来的模型识别效果良好

使用的主机是英特尔（Intel）NUC11PHKi7CAA幻影峡谷11代酷睿i7RTX2060独显迷你电脑主机
https://item.jd.com/10028216825202.html

现在临时想到能够提供的暂时这些，如有解决方案我将不胜感激

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
kakaccys 2022-08-13 07:47
关注
看darknet的git，解决方案是将cuda升级到11.1，cudnn也升级，才能解决这个卡住的问题，和显卡有点关系

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

使用Yolov4训练自己的数据集(20240415版）
2024-04-15 23:55

冰万森的博客本实验使用了Yolov4和PyTorch训练了水果数据集，实现水果的识别分类，数据集主要有dragon fruit，snake fruit，pineapple(火龙果、蛇果、菠萝)三种水果的图片共计200张，最后mAP达到89.17%，并成功预测了水果图片的...
YOLOv11训练自己的数据集：从标注到部署完整流程
2025-12-28 21:57

PassatCC的博客本文详解如何利用容器化环境与增强版YOLO模型，快速完成目标...涵盖数据标注规范、Docker镜像使用技巧、训练调优策略及ONNX/TensorRT部署方案，帮助团队绕开环境配置和模型导出的常见坑，实现从零到落地的高效闭环。
使用Yolov4训练自己的数据集（cyq）
2024-04-28 23:11

心碎小ki的博客养成好习惯，有requirements.txt先看requirements.txt，这里是把所需要的包都罗列出来了，如果只想用CPU训练数据集和预测，可以直接安装，如果是想要GPU和Cuda训练和预测数据集，记得删除torch和torchvision那两行，...
自己制作数据集并用yolov8进行训练（最简单版本）
2024-12-13 00:38

1-----2的博客 windows10 pycharm2024.1 python 3.9按照yolov8的环境进行...使用pip install -r requirements.txt进行下载，下载数据集的时候看看报不报错记得再加一个yolo的环境： https://blog.csdn.net/qq_22721735/article/deta
#YOLOv5 实现目标检测训练自己的数据集
2024-10-31 15:29

汪小敏同学的博客能够将对应的信息保存到唯一一个label文件中去 labal文件中的格式：calss x y w h　同时，一张图片对应的类别有多个，所以对应的ｂｕｎｄｉｎｇ的信息也有多个 '''最后，在根目录中对train.py中的一些参数进行修改，...
yolov10l训练时epoch进度条卡住，如何解决？
2025-06-23 20:30

bug菌¹的博客本文收录于《全栈Bug调优(实战版)》专栏，该专栏专注于分享我在真实项目开发中遇到的各类疑难Bug及其深层成因，并系统提供高效、可复现的解决思路和实操方案。无论你是刚入行的新手开发者，还是拥有多年项目经验的...
YOLOv5训练自定义数据集全攻略
2025-12-16 13:51

Bobby陈兴博的博客本文详细介绍如何使用YOLOv5训练VisDrone2019数据集，涵盖环境配置、代码下载、PyCharm项目导入、依赖安装、配置文件修改及模型训练全过程，适合初学者快速上手目标检测任务。
PaddlePaddle YOLOv3目标检测实战：自定义数据集训练
2025-12-27 01:41

不吃香菜的鱼的博客手把手教你使用PaddlePaddle和YOLOv3训练专属目标检测模型，覆盖数据标注、环境配置、训练调优到模型部署全流程。针对工业质检等实际场景，解决小目标检测、显存不足、过拟合等常见痛点，并提供Anchor优化、量化压缩...
YOLOv8模型微调实战：自定义数据集训练全流程讲解
2025-12-31 15:36

凯二七的博客通过Docker快速搭建YOLOv8训练环境，详解从数据准备、模型选择到训练优化的完整微调流程，帮助开发者高效实现工业检测、缺陷识别等特定场景的目标检测任务，避开环境配置坑，聚焦业务落地。
【YOLOv5目标检测教学】包括环境配置、数据集制作、模型训练、加载模型进行目标检测（超详细、小白入门版）
2024-10-21 14:14

音沐mu.的博客本文将全面阐述yolov5目标检测使用教学，首先是配置yolov5的运行环境以及yolov5的代码下载，然后教学如何制作自己的目标检测数据集以及如何利用yolov5加载该数据集进行目标检测模型训练，最后教学如何通过yolov5加载...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金50元 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月12日

在yolov3下训练自己的数据集卡住

在yolov3下训练自己的数据集卡住

问题相关代码

我的解答思路和尝试过的方法

说明

2条回答 默认 最新

问题事件

2条回答默认最新