赵凉 2023-09-12 21:44 采纳率: 0%
浏览 36

poseformerv2,输入序列为81帧时的精度复现问题

输入81帧,保留中间一帧,dct为3时,做出来的最好精度为48.3,达不到47.6,学习率0.0001,0.0008都试过,batchsize1024,512,2048也试过,做不出来,有和我一样情况的么?27帧时的情况倒是复现出来了,如有回答,不胜感谢!

  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-09-13 08:26
    关注

    【以下回答由 GPT 生成】

    问题描述中提到了使用poseformerv2模型处理81帧的输入序列,并保留其中的中间一帧,但最佳精度只有48.3,而期望的精度应该是47.6。已经尝试了不同的学习率和批量大小,但都未能满足要求。并且希望知道是否有其他人也遇到了类似的情况,并希望得到一些建议。

    针对这个问题,我提几个可能的解决方案和建议:

    1. 调整模型参数:尝试调整poseformerv2模型中的参数,例如增加模型的深度或宽度,使用更复杂的网络结构,或增加模型中的注意力头数等,以提高模型的性能和精度。

    2. 增加训练数据:如果可能的话,可以尝试增加更多的训练数据,这有助于提高模型的泛化能力和精度。可以尝试使用数据增强技术,如旋转、平移、裁剪等来扩充数据集。

    3. 调整学习率和训练策略:除了已尝试的学习率外,还可以尝试使用其他学习率调度器或优化器,如AdamW等。可以尝试使用不同的学习率衰减策略,如cosine annealing、warm-up等。

    4. 调整数据预处理:检查数据预处理的方式是否正确,确保输入数据的尺寸、标准化、缩放等处理步骤正确。如果数据存在异常值或噪声,可以尝试使用滤波或去噪技术来净化数据。

    5. 进行模型调试和分析:可以使用模型解释技术,如Grad-CAM、Attention等,来了解模型在哪些区域关注度较高或较低,从而判断是否存在特征提取不准确或关键帧选择问题。

    6. 参考其他研究和论文:搜索poseformerv2相关的研究或论文,了解其他人是否也遇到了类似的问题,并尝试参考他们的解决方案或建议。

    虽然我不能提供完整的解决方案,但希望这些建议能对你有所帮助。如果还有其他问题,请随时提出。


    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 创建了问题 9月12日