detr训练精度为0

您好，我在参考您的教程训练detr，没有报错，但是最后的结果都是0。参考您之前的回答，第一次我没有雨下了模型，在第二次resume我使用您代码里面转换的与训练模型，但是结果还是全部是0。所有步骤都按照您的博文，我不是很明白是那里出问题咯，请问您遇到这问题吗？

def get_args_parser():
    parser = argparse.ArgumentParser('Set transformer detector', add_help=False)
    parser.add_argument('--lr', default=1e-4, type=float)
    parser.add_argument('--lr_backbone', default=1e-5, type=float)
    parser.add_argument('--batch_size', default=2, type=int)
    parser.add_argument('--weight_decay', default=1e-4, type=float)
    parser.add_argument('--epochs', default=300, type=int)
    parser.add_argument('--lr_drop', default=200, type=int)
    parser.add_argument('--clip_max_norm', default=0.1, type=float,
                        help='gradient clipping max norm')

    # Model parameters
    parser.add_argument('--frozen_weights', type=str, default=None,
                        help="Path to the pretrained model. If set, only the mask head will be trained")
    # * Backbone
    parser.add_argument('--backbone', default='resnet50', type=str,
                        help="Name of the convolutional backbone to use")
    parser.add_argument('--dilation', action='store_true',
                        help="If true, we replace stride with dilation in the last convolutional block (DC5)")
    parser.add_argument('--position_embedding', default='sine', type=str, choices=('sine', 'learned'),
                        help="Type of positional embedding to use on top of the image features")

    # * Transformer
    parser.add_argument('--enc_layers', default=6, type=int,
                        help="Number of encoding layers in the transformer")
    parser.add_argument('--dec_layers', default=6, type=int,
                        help="Number of decoding layers in the transformer")
    parser.add_argument('--dim_feedforward', default=2048, type=int,
                        help="Intermediate size of the feedforward layers in the transformer blocks")
    parser.add_argument('--hidden_dim', default=256, type=int,
                        help="Size of the embeddings (dimension of the transformer)")
    parser.add_argument('--dropout', default=0.1, type=float,
                        help="Dropout applied in the transformer")
    parser.add_argument('--nheads', default=8, type=int,
                        help="Number of attention heads inside the transformer's attentions")
    parser.add_argument('--num_queries', default=100, type=int,
                        help="Number of query slots")
    parser.add_argument('--pre_norm', action='store_true')

    # * Segmentation
    parser.add_argument('--masks', action='store_true',
                        help="Train segmentation head if the flag is provided")

    # Loss
    parser.add_argument('--no_aux_loss', dest='aux_loss', action='store_false',
                        help="Disables auxiliary decoding losses (loss at each layer)")
    # * Matcher
    parser.add_argument('--set_cost_class', default=1, type=float,
                        help="Class coefficient in the matching cost")
    parser.add_argument('--set_cost_bbox', default=5, type=float,
                        help="L1 box coefficient in the matching cost")
    parser.add_argument('--set_cost_giou', default=2, type=float,
                        help="giou box coefficient in the matching cost")
    # * Loss coefficients
    parser.add_argument('--mask_loss_coef', default=1, type=float)
    parser.add_argument('--dice_loss_coef', default=1, type=float)
    parser.add_argument('--bbox_loss_coef', default=5, type=float)
    parser.add_argument('--giou_loss_coef', default=2, type=float)
    parser.add_argument('--eos_coef', default=0.1, type=float,
                        help="Relative classification weight of the no-object class")

    # dataset parameters
    parser.add_argument('--dataset_file', default='coco')
    parser.add_argument('--coco_path', type=str,default='/mnt/lxrnew/container_dataset/fundation_data/')
    parser.add_argument('--coco_panoptic_path', type=str)
    parser.add_argument('--remove_difficult', action='store_true')

    parser.add_argument('--output_dir', default='/mnt/lxrnew/Vir_new/detr-main/output',
                        help='path where to save, empty for no saving')
    parser.add_argument('--device', default='cuda',
                        help='device to use for training / testing')
    parser.add_argument('--seed', default=42, type=int)
    parser.add_argument('--resume', default='./pretain_weight/detr-r50_2.pth', help='resume from checkpoint')
    parser.add_argument('--start_epoch', default=0, type=int, metavar='N',
                        help='start epoch')
    parser.add_argument('--eval', action='store_true')
    parser.add_argument('--num_workers', default=2, type=int)

    # distributed training parameters
    parser.add_argument('--world_size', default=1, type=int,
                        help='number of distributed processes')
    parser.add_argument('--dist_url', default='env://', help='url used to set up distributed training')
    return parser

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
暮已深 2023-12-20 13:34
关注
你的目标只有一类吗？batch_size太小了，也有可能是这个原因，设置为8,16试试呢，如果内存不够设为6也行

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

FP-DETR：通过完全预训练提升transformer目标检测器
2022-04-01 20:23

计算机视觉研究院的博客尽管UP-DETR[10]尝试通过无监督的方法来预训练transformer，它的预训练过程依赖已经训练好的主干网络，并且主干网络和transformer两部分是分别预训练的。我们认为利用预训练提升detection transformer性能面临的...
【课程设计】TensorRT部署DETR项目工程C++源码.zip
2025-01-05 21:40

C++作为本课程设计的主要编程语言，提供了与硬件紧密集成的能力，为TensorRT的高效执行提供了必要的基础。在进行DETR模型部署的过程中，开发者需要编写源码来完成模型的加载、预处理、推理以及后处理等工作流程。...
Deformable-Attention-for-Deformable-DETR
2021-04-14 22:35

Deformable-DETR的实现主要基于Python编程语言，利用PyTorch框架进行深度学习模型的构建。在提供的压缩包文件中，`Deformable-Attention-for-Deformable-DETR-main`包含了实现变形注意力机制的相关代码，包括模型...
RT-DETR 项目常见问题解决方案
2024-09-13 22:09

邱焘佳Simona的博客 RT-DETR 是一个用于实时目标检测的开源项目，基于 Transformer 架构，旨在提供比 YOLO 系列更高效的实时目标检测性能...RT-DETR 支持 PaddlePaddle 和 PyTorch 两种深度学习框架，提供了多种预训练模型，包括 RT-DE...
开放词汇航拍目标检测：OVA-DETR的高效应用
2024-12-11 20:37

神秘泣男子的博客 OVA-DETR是一种用于航空目标检测的高效率开放词汇检测器，它利用图像-文本对齐和融合技术。具体来说，为了打破传统检测器中预定义类别的限制，将类别语义整合到检测器中，并构建了一个区域-文本对比损失，以对齐图像...
C++实现基于ONNXRuntime的完整推理流程，包括YOLOv5、YOLOv8、RT-DETR等。（保姆级代码）.z
2025-08-22 18:43

在当今的人工智能与机器学习领域，深度学习模型的推理过程是将...以上内容可能会涉及对深度学习、机器学习、计算机视觉等领域的技术理解和应用，同时也需要熟悉C++编程、网络编程以及可能涉及的其他编程语言和技术栈。
YOLOv7官方开源 | Alexey Bochkovskiy站台，精度速度超越所有YOLO，还得是AB
2022-07-08 07:00

3Ｄ视觉工坊的博客 Mask R-CNN (8.6 FPS A100, 55.2% AP) 速度提高 551%，准确率提高 0.7%，以及 YOLOv7 的表现还优于：YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、 DETR、Deformable DETR、DINO-5scale-R50、ViT-Adapter-B 和许多其他速度...
基于Windows环境展示了基于OpenVINO C++、Python和C#API的RT-DETR模型案例的部署
2024-02-29 21:00

Inference Engine支持多种编程语言，包括C++、Python和C#。接下来，我们将按照以下步骤在Windows环境下部署RT-DETR模型： 1. **安装准备**： - 安装Visual Studio或Visual Studio Code以支持C++和C#开发。 - ...
【精选毕业设计】TensorRT的C++推理库支持YOLO+RT-DETR+单目标跟踪OSTrack和LightTrack源码+项目说明.zip
2025-01-05 21:37

项目中的源码部分可能包括了模型的加载、预处理、推理执行以及后处理等关键步骤，使用C++编程语言实现，以便更好地利用NVIDIA GPU的计算能力。除了源码外，项目还包括了详细的项目说明文档，用于指导用户如何正确...
DETR 项目常见问题解决方案
2024-09-13 21:52

惠澜纯Rowena的博客 DETR 项目常见问题解决方案【免费下载链接】detr End-to-End Object Detection with Transformers 项目地址: https://gitcode.com/gh_mirrors/de/...
人工智能混合编程实践：Python AgentOCR进行文本识别
2025-03-18 19:35

FriendshipT的博客使用Kaggle GPU资源免费体验Stable Diffusion开源项目相关介绍 Python简介 Python 是一种高级编程语言，因其简洁、高度可读的代码而广受欢迎。它支持多种编程范式，包括面向对象编程（OOP）、命令式编程、函数式...
512块A100，AlphaFold训练时间从11天压缩至67小时：尤洋团队FastFold上线
2022-03-06 17:00

计算机视觉研究院的博客借助深度神经网络，AlphaFold 能够周期性地以原子精度预测蛋白质结构，但 AlphaFold 模型的训练和推理由于其特殊的性能特点和巨大的内存消耗，既耗时又昂贵。基于此，来自潞晨科技和上海交大的研究者提出了一种...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月19日

detr训练精度为0

1条回答 默认 最新

问题事件

1条回答默认最新