yolov8训练自己数据集，batch设置问题！

yolov8训练数据集时，batch只有设置为1才能正确训练，不然就会出现这种情况
有kind man知道怎么回事？怎么解决吗？yolov8的原代码一点没动


```python
Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size
       5/50      2.34G        nan        nan        nan         30        640:

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-12-07 18:43
关注
【相关推荐】

这篇博客: 理解 YOLOv3 的训练输出日志信息中的 Batch 输出 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

针对上图中最后一行中的信息, 我们来一步一步的分析。如下的输出是由 detector.c 生成的, 具体代码见：
点击打开链接.
部分关键代码如下:

... if (avg_loss < 0) avg_loss = loss; avg_loss = avg_loss*.9 + loss*.1; i = get_current_batch(net); printf("%ld: %f, %f avg, %f rate, %lf seconds, %d images\n", get_current_batch(net), loss, avg_loss, get_current_rate(net), what_time_is_it_now()-time, i*imgs); ...

9798：指示当前训练的迭代次数;
0.370096：是总体的 Loss(损失）;
0.451929 avg：是平均 Loss, 这个数值应该越低越好, 一般来说, 一旦这个数值低于 0.060730 avg 就可以终止训练了;
0.001000 rate：代表当前的学习率, 是在.cfg文件中定义的;
3.300000 seconds：表示当前批次训练花费的总时间;
627072 images：这一行最后的这个数值是 9798*64 的大小, 表示到目前为止, 参与训练的图片的总量.

以下输出是我在训练 VOC 时达到 283234 次迭代时候的输出:

283234: 0.783273, 0.827796 avg, 0.000020 rate, 1.650999 seconds, 33988080 images

可以看到 28W 次的训练之后, Loss 和 Avg Loss 并没有降低到 0.1 以下. 但是模型检测目标的准确率也已经很高了, 这就说明如果 Loss 和 Avg Loss 随着训练迭代次数的增加下降幅度变化很小, 这时就可以测试训练得到的模型了.

当然在实际应用过程中, 并不是 Loss 越低, 模型的精度和泛化性能越好.

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

yolov5训练自己的数据集时出现的的问题人工智能开发语言深度学习
2022-05-25 21:20

回答 1 已采纳配置文件后缀是yaml而不是pt模型
yolov4训练数据集出错。 python tensorflow 有问必答深度学习
2021-07-03 07:13

回答 2 已采纳对于此问题，从网上查阅看解决的尝试多种多样，主要有，1.将代码中使用np的函数改成用tf中的函数。如bias_inv = np.arctanh(bias)，改成bias_inv = tf.math.a
yolov5训练自己的数据集train.py python
2022-04-29 09:10

回答 2 已采纳你这槽点不是一般的多，cuda要和前面的匹配，前面的cuda版本号要一致
Yolov5训练自己的数据集（详细完整版）
2021-12-03 16:32

缔宇diyu的博客新版小白式手把手完整无坑版教程。从安装yolov5、视频转图片、标注图片开始，到详细说明如何训练自己的数据集，训练时间、出现的多种问题说明、训练可视化、检测效果。
在yolov3下训练自己的数据集卡住 ubuntu 深度学习目标检测
2022-08-12 21:21

回答 2 已采纳看darknet的git，解决方案是将cuda升级到11.1，cudnn也升级，才能解决这个卡住的问题，和显卡有点关系
YOLOv5 训练数据集的时候报错 python 有问必答
2021-07-15 17:34

回答 2 已采纳你好，我是有问必答小助手。为了技术专家团更好地为您解答问题，烦请您补充下（1）问题背景详情，（2）您想解决的具体问题，（3）问题相关代码图片或者报错信息。便于技术专家团更好地理解问题，并给出解决方案。
YOLOv5(PyTorch)实战：训练自己的数据集课程中遇到的问题 pytorch
2022-04-05 21:57

回答 1 已采纳 in "models/yolov5s_ball.yaml", line 5, column 1检查以下这个文件，这里出现的错误
YOLOv8训练自己的数据集+常用传参说明
2023-10-24 17:26

清如许.的博客 yolov8已经出来好几个月了，并且yolov8从刚开始出来之后的小版本也升级好几次，总体变化不大，个别文件存放位置发生了变化，以下以最新版本的YOLOv8来详细学习和使用YOLOv8完成一次目标检测。
yolov5训练结果只有loss为0 python 机器学习深度学习
2022-10-13 20:50

回答 1 已采纳单个类别的时候，train里面要将single-cls设置为true，或者参数里面加上--single-cls
yolov3 darknet训练出现的Segmentation fault (core dumped)的问题人工智能机器学习计算机视觉
2021-08-03 19:13

回答 1 已采纳训练一两分钟出错最大的可能还是你的数据集的问题，标签看下是不是有多了一个类别。建议写个代码遍历一下标签文件，找下class id不是0的种类
yolov5为什么默认要训练300次这么多人工智能深度学习神经网络
2021-04-05 20:56

回答 2 已采纳 mmdetection没试过，但是yolov5默认300多次是因为人家是在coco数据集上面训练的，而你看yolov5的主页，里面的各个模型的对比可以看出来，基本上都是300epoch的时候达到较好的
YOLOv8训练自己的数据集(超详细)
2023-01-11 17:54

AI追随者的博客 YOLOv8训练自己数据集的详细教程
训练yolov7遇上的问题 pycharm python 有问必答目标检测
2022-10-07 15:16

回答 4 已采纳应该是你没有提前下载好预训练权重放在本地，导致脚本使用git命令下载时连接超时。所以提前下载好对应网络结构的预训练权重应该就行了。此外，根据提示执行pip install wandb，以及配置一下可以
YOLOv8训练自定义数据集(超详细)
2023-03-02 10:30

往事如yan的博客借鉴 YOLOv8训练自己的数据集(超详细)_AI追随者的博客-CSDN博客一、准备训练环境安装 requirements.txt 下载：https://raw.githubusercontent.com/ultralytics/ultralytics/main/requirements.txt 然后在你目录下...
YOLOV8训练自己的数据集
2023-09-05 14:18

相识已是上上签的博客 YOLOV8快速上手训练自己的数据集并进行预测
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月7日

悬赏问题

¥15 关于#java#的问题，请各位专家解答！
¥15 急matlab编程仿真二阶震荡系统
¥20 TEC-9的数据通路实验
¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
¥50 MATLAB实现圆柱体容器内球形颗粒堆积
¥15 python如何将动态的多个子列表，拼接后进行集合的交集
¥20 vitis-ai量化基于pytorch框架下的yolov5模型
¥15 如何实现H5在QQ平台上的二次分享卡片效果？
¥30 求解达问题（有红包）
¥15 请解包一个pak文件

yolov8训练自己数据集，batch设置问题！

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新