训练模型时hmean 和 acc的值会一直是零(paddle)

需要实现在一张截图里只要部分区域的文字信息
想用paddle想训练一个模型时使用:
文本检测模型:ch_PP-OCRv3_det_cml.yml 和对应的训练模型
文本识别模型:ch_PP-OCRv3_rec_distillation.yml 和对应的训练模型
发现两个训练完之后会显示
best metric, hmean: 0, is_float16: False
best metric, acc: 0, is_float16: False
配置文件里面参数只是修改了训练模型路径,数据集;标签;评估标签路径
想知道为什么hmean 和 acc的值会一直是零？或者说可能是那些原因？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-06-19 10:23
关注
引自免费微信小程序：皆我百晓生

遇到在训练模型时hmean和acc值一直为零的问题，这通常意味着模型没有从训练数据中学习到有效的信息，或者遇到了一些阻碍学习过程的障碍。下面是一些可能的原因以及相应的解决策略：

1. 数据质量问题

检查数据集：确保数据集正确无误，包括图像和标签。查看是否有损坏的图像或不正确的标签。
数据预处理：确认数据预处理步骤是否恰当，例如缩放、裁剪、增强等操作是否正确实施。

2. 模型结构与初始化

模型结构：确认使用的模型结构是否适合当前任务。有时，即使是先进的模型也可能不适合特定的数据集或任务。
权重初始化：检查模型权重初始化是否合适。不恰当的初始化可能导致模型陷入局部最小值或梯度消失/爆炸。

3. 超参数设置

学习率：过高的学习率可能导致模型训练不稳定，而过低的学习率则可能使模型学习缓慢或停滞。尝试调整学习率。
批次大小（batch size）：太大的批次可能导致内存溢出，太小的批次可能影响梯度估计的稳定性。
优化器选择：不同的优化器（如SGD、Adam、RMSprop等）可能对模型的表现有显著影响。尝试更换优化器。

4. 训练细节

训练时间：确保模型训练足够长的时间。有时候模型需要更多迭代才能开始学习。
验证集：确认验证集是否正确划分且与训练集不重叠。

5. 损失函数与评估指标

损失函数：确认损失函数是否正确应用于当前任务。对于分类任务，常见的损失函数是交叉熵损失；对于回归任务，则可能是均方误差损失。
评估指标：hmean和acc分别代表F1分数和准确率。确保这些指标的计算方式正确，并且适用于你的任务类型。

解决方案示例

假设你正在使用PaddlePaddle框架，可以尝试以下步骤：

调整学习率：在配置文件中修改学习率，例如从默认值0.001开始调整。

Optimizer: learning_rate: 0.0005 # 尝试减小学习率

增加数据增强：在数据加载部分增加更多的数据增强操作，以提高模型泛化能力。

from paddle.vision.transforms import Compose, RandomHorizontalFlip, Resize transform = Compose([Resize((224, 224)), RandomHorizontalFlip()])

检查标签格式：确保标签数据与模型期望的格式一致。例如，对于分类任务，标签应为整数类标。

如果上述方法都无法解决问题，建议检查模型训练日志中的更多信息，比如损失值是否在下降，梯度是否正常等，以进一步定位问题所在。此外，尝试在较小的数据集上先进行测试，以排除数据量过大导致的潜在问题。如果问题仍然存在，考虑查阅相关文献或社区论坛，寻找类似问题的解决方案。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Paddle进阶实战系列（四）：基于PaddleOCR的体检报告识别
2022-08-27 09:19

GoAI的博客划分部分数据集用于训练，将det.txt拆成train_det_new1_hebing.txt和test_det_new1_hebing.txt，注意生成的训练测试集txt名字要跟训练时相同 # !python split_data.py #2.划分全量数据集,将det_new_hebing_all.txt拆...
炸裂！PDF转Word彻底告别收费时代，这个OCR开源项目要逆天！
2024-10-10 16:02

疯狂的超级玛丽的博客图1 PDF文件转Word文件效果图：新增图像矫正和版面复原模块，支持标准格式pdf和图片格式pdf解析！版面分析：发布轻量级版面分析模型，，平均!表格识别：设计3大优化策略，预测耗时不变情况下，。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月19日

训练模型时hmean 和 acc的值会一直是零(paddle)

3条回答 默认 最新

1. 数据质量问题

2. 模型结构与初始化

3. 超参数设置

4. 训练细节

5. 损失函数与评估指标

解决方案示例

问题事件

3条回答默认最新