ppocr训练检测模型时出现问题

ppocr在运行训练检测模型时出现了问题,环境为docker环境
命令:python3 tools/train.py -c configs/det/ch_PP-OCRv4/ch_PP-OCRv4_det_cml.yml -o Global.save_model_dir=./output/ Global.pretrained_model=./pre_train/ch_PP-OCRv4_det_train/best_accuracy
以下为配置文件

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
恐怖如斯恐怖如斯啊 2025-01-16 10:38
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

从你给出的错误信息来看，这个问题似乎是由于内存不足引起的。特别是提示信息提到了 "insufficient shared memory"，这可能意味着你的系统共享内存（shm）空间不足。

以下是几个可能的解决方案：

增加共享内存空间：在Docker环境中，你可以尝试增加/dev/shm的大小。你可以通过运行以下命令来查看当前的大小：

df -h /dev/shm

如果空间不足，你可以尝试增加它的大小。具体的步骤取决于你的操作系统和Docker配置。你可能需要编辑Docker的配置文件并重新启动Docker服务。注意，这需要管理员权限。

降低批量大小（batch size）：在你的训练配置中，batch size per card设置为16，你可以尝试减小这个值，以减少内存使用。例如，你可以尝试设置为8或4。
减少数据加载器的工作进程数（num workers）：在你的配置中，num workers设置为8，这表示数据加载器有8个工作进程。过多的工作进程可能会消耗大量内存。你可以尝试减少这个值，例如设置为4或2。
检查你的数据集：确保你的数据集没有损坏或格式不正确的文件，这可能会导致数据加载器在读取数据时出现问题。尝试清理或重新准备你的数据集，并确保所有文件的路径和格式都是正确的。

如果这些更改无法解决你的问题，我建议你查看更详细的日志信息以获取更多线索。尝试找到错误发生在代码的具体位置，这可能有助于确定问题的根源。此外，确保你的Docker容器和PaddleOCR版本都是最新的，以避免由于软件版本不匹配而导致的问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

X-AnyLabeling：使用X-AnyLabeling训练YOLOv8目标检测模型
2025-08-28 22:08

FriendshipT的博客 Python、Pytorch、人工智能、X-AnyLabeling、标注工具、Ultralytics、目标检测
X-AnyLabeling：使用X-AnyLabeling训练YOLO11目标检测模型（脑肿瘤检测）
2025-08-29 10:36

FriendshipT的博客 Python、Pytorch、人工智能、X-AnyLabeling、标注工具、Ultralytics、目标检测
LangPipe大语言模型Pipeline应用框架案例介绍
2025-04-26 04:35

MgmmmmgM的博客 **选择合适的模型和平台**：根据你的具体需求选择一个合适的预训练语言模型（如我Qwen）或平台，如阿里云等提供的服务。 3. **输入与输出格式**：了解并遵循所选模型的输入与输出格式要求。这通常包括如何提出问题...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日

ppocr训练检测模型时出现问题

1条回答 默认 最新

问题事件

1条回答默认最新