mmdetection

mmdetection运行mask rcnn，训练模型时运行train.py出现RuntimeError: CUDA out of memory. Tried to allocate 1.77 GiB（网上的教程都是在测试时出现这个问题，我为什么训练就出现了）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

27条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-05-20 12:18
关注
获得0.15元问题酬金
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

您想要解决的问题

您遇到的问题是在运行mmdetection框架下的Mask R-CNN模型训练时，出现了CUDA内存不足的错误。具体来说，系统尝试分配1.77 GiB的GPU内存，但已经超出了GPU的总容量或可用内存。

图片内容

您上传的图片包含了mmdetection框架中fcn_mask_head.py文件的代码片段，特别是与_do_paste_mask函数相关的部分。这个函数在执行时尝试创建一个网格，但因为内存不足导致运行时错误。

问题出现原因

内存需求过大：您的模型或数据可能需要的内存超过了GPU的可用容量。
内存泄漏：代码中可能存在内存泄漏，导致内存没有被正确释放。
批量大小设置不当：如果批量大小（batch size）设置得过大，可能会导致超出内存限制。
数据预处理：数据预处理阶段可能产生了过大的中间数据结构。

问题解决方案

减小批量大小：尝试减少训练时的批量大小，以减少每次迭代所需的内存。
优化数据加载：确保数据加载和预处理不会占用过多内存。
使用更小的模型：如果可能，尝试使用一个更小的模型架构。
内存管理：根据错误提示，可以尝试设置max_split_size_mb来避免内存碎片。
使用多个GPU：如果您有多个GPU，可以尝试使用数据并行来分散内存需求。

提供代码

由于您的问题涉及到内存管理，而不是特定代码段的问题，因此没有特定的代码修改建议。但是，您可以尝试以下代码片段来动态调整批量大小：

# 假设您的原始批量大小为batch_size batch_size = 32 # 举例 while True: try: # 运行您的训练代码 train_model(batch_size) break except RuntimeError as e: if 'CUDA out of memory' in str(e): batch_size = max(1, batch_size // 2) # 减半批量大小 print(f"Reducing batch size to {batch_size}") else: raise

代码运行方式

确保您的环境中安装了mmdetection、PyTorch以及所有必要的依赖。
调整上述代码中的batch_size，然后运行您的训练脚本。

代码预期运行结果

如果代码能够成功运行，您应该能够看到训练过程开始，并且不会因为内存不足而中断。

推荐相关链接

mmdetection官方文档
PyTorch CUDA内存管理
如何优化深度学习模型的内存使用
解决CUDA内存不足的错误
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

mmdetection test的结果都是0.000x python 深度学习目标检测
2022-07-22 09:29

回答 1 已采纳 test数据和你train的数据是不是不太搭?看样子像是数据问题
MMdetection配置文件中的参数的求解目标检测计算机视觉
2022-11-18 12:38

回答 2 已采纳不对啊，数据集的数量肯定不不会变的，怎么可能同个数据集，第一次3759张图，换个参数后第二次只有1880张图。总量肯定是不会变的。这些参数对数据集来说是没有影响的，总能加载进去的。
目标检测开源框架MMDetection训练的时候报错，如何解决深度学习
2021-04-02 13:31

回答 2 已采纳 1、问题分析出现这种情况，很有可能是你在开始安装mmcv-full的时候，没有指定版本，直接安装的。采用这样默认安装mmcv-full的方式，如果与你环境里的cuda和torch版本不匹配，就
MMDetection实战：MMDetection训练与测试
2022-05-09 21:20

MMDetection是商汤和港中文大学针对目标检测任务推出的一个开源项目，它基于Pytorch实现了大量的目标检测算法，把数据集构建、模型搭建、训练策略等过程都封装成了一个个模块，通过模块调用的方式，我们能够以很少的...
PaddleDetection的判别原理是什么？ paddle 人工智能计算机视觉
2022-10-17 18:54

回答 4 已采纳做深度学习需要大量的标注数据，我们按照什么样的标准去标注数据，模型就会学习什么样的判别标准。你所描述的错误识别现象，很有可能是模型训练不到位（具体原因可能为：1、训练数据中没有描述这种状态；2、数据标
TensorFlow-Lite Object-Detection转成tflite文件，代转 tensorflow 人工智能目标检测
2021-06-22 21:25

回答 1 已采纳望采纳，谢谢 TensorFlowLite 需要tflite文件模型，这个模型可以由TensorFlow训练的模型转换而成。所以首先需要知道如何保存训练好的TensorFlow模型。一般有这几
Edge Detection 算法
2017-08-02 12:07

回答 1 已采纳 http://blog.csdn.net/rongyongfeikai2/article/details/7182098
mmdetection源码注释
2021-01-17 10:30

商汤科技（2018 COCO 目标检测挑战赛冠军）和香港中文大学最近开源了一个基于Pytorch实现的深度学习目标检测工具箱mmdetection，支持Faster-RCNN，Mask-RCNN，Fast-RCNN等主流的目标检测框架，后续会加入Cascade-...
Signal Detection
2017-04-18 14:11

回答 1 已采纳 http://www.acmerblog.com/hdu-3712-detector-placement-6692.html
Collision Detection
2017-11-25 14:02

回答 2 已采纳 http://www.mamicode.com/info-detail-956432.html
Image copy detection
2017-11-21 16:43

回答 1 已采纳 https://blog.csdn.net/liluoyu_1016/article/details/80086723
mmdetection
2021-02-22 17:55

《mmdetection：深度学习中的目标检测框架》 mmdetection是深度学习领域中一个备受瞩目的开源目标检测...通过PyTorch的灵活性和易用性，mmdetection使得目标检测技术更加普及，为AI领域的研究与开发带来了极大的便利。
mmdetection3d 训练
2022-06-14 08:45

Coding的叶子的博客 mmdetection3d 训练本节以SECOND算法为例，简要介绍mmdetection3d second算法训练过程，含数据和python源码详细介绍。 1 mmdetection3d环境安装 mmdetection3d环境详细安装和调试请参考：【mmdetection3d】mm...
Python调用MMDetection实现AI抠图去背景
2023-02-20 16:33

何小有的博客为基础，需要安装好 MMDetection 的运行环境，同时完成目标检测、实例分割和全景分割的功能实践，之后再看下面的内容。模型库中的实例分割（Instance Segmentation）模型，来帮我们完成最核心的分类、分割图片物体...
【mmdetection】mmdetection安装详细步骤
2022-06-05 09:31

Coding的叶子的博客【mmdetection】mmdetection安装详细步骤
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月20日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

mmdetection

27条回答 默认 最新

您想要解决的问题

图片内容

问题出现原因

问题解决方案

提供代码

代码运行方式

代码预期运行结果

推荐相关链接

问题事件

悬赏问题

27条回答默认最新