测试结果只有原论文的一半这个是为什么？

我找的一篇论文，他用的是四张A6000进行训练的，而我的是四张2080Ti，batch size只能调成他的一半，测试结果也只有他的一半。但是我用他给的pth文件直接测试，结果与他的一样。
然后我想是不是batch size的问题，于是我就用tiny作为backbone训练，bs与他调成一样，但是测试结果依旧是他的一半。是不是四张卡不同导致的问题，但是这不应该啊？能不能有个朋友帮我解决一下，万分感谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-22 15:20
关注
引自免费微信小程序：皆我百晓生

看起来你在尝试复现一篇深度学习论文的结果，并且已经注意到硬件配置（GPU型号）的变化可能对实验结果产生影响。不过，从你描述的情况来看，还有其他几个可能的原因导致结果差异：

数据预处理：确保你的数据预处理步骤与论文中的完全一致。包括图像的缩放、归一化、数据增强等操作。
模型结构：虽然你使用了不同的backbone（Tiny），但确认是否在其他层面上保持了一致，比如网络头的设置、损失函数、优化器的选择以及其参数等。
训练细节：检查训练循环中的关键参数，例如学习率、衰减策略、批标准化、权重初始化方法、正则化（Dropout、L2惩罚）、早停等。
随机性的影响：由于深度学习中的随机性（如权重初始化、数据加载顺序等），每次训练可能会得到略微不同的结果。为了消除这个影响，可以运行多轮训练并取平均结果。
模型保存和加载：确认你正确地加载了论文作者提供的模型权重，并且在评估时没有重新开始训练。
验证集和测试集划分：确保你的验证集和测试集划分方式与论文相同，以减少偏差。
精度计算：核对你们的性能指标（如准确率、AP等）计算方法是否一致。

针对这些点，你可以采取以下步骤来排查问题：

数据预处理：确保你的数据预处理代码与论文中的一致，可以将代码贴出来，我会帮你审查。

模型结构：你可以使用torch.nn.Module.dump_patches()方法输出模型的结构信息，然后与论文中的对比。

import torch def print_model(model): print(model) torch.save(model.state_dict(), 'model.pth') with open('model.txt', 'w') as f: model.dump_patches(f) # 将你的模型替换为'model' print_model(model)

训练细节：检查你的train.py或类似脚本中的所有相关参数，确保它们与论文中的值匹配。

随机性：在代码中加入固定的随机种子，以确保可重复性。

import numpy as np import random import torch np.random.seed(42) random.seed(42) torch.manual_seed(42) torch.cuda.manual_seed_all(42)

模型加载：确保加载模型的代码正确无误，不包含任何额外的训练或微调。

import torch def load_pretrained_model(model, path): state_dict = torch.load(path, map_location='cpu') model.load_state_dict(state_dict) return model # 将你的模型替换为'model'，并将路径替换成论文作者提供的pth文件路径 model = load_pretrained_model(model, 'path_to_paper_model.pth')

验证集和测试集划分：使用相同的划分方法，或者如果论文未提供具体信息，则采用常见的划分比例（如80/10/10分训练集、验证集和测试集）。

精度计算：如果可能，参考论文中提到的精确度计算公式，或者使用开源库（如pycocotools）提供的函数进行计算。

通过以上步骤，你应该能逐步找到问题所在。如果你在执行过程中遇到具体代码问题或有更详细的信息，欢迎继续提问。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python支持向量机为什么输出结果会变来变去？ python 人工智能有问必答机器学习
2021-06-06 01:55

回答 2 已采纳你可以设置一下random state这个参数，划分数据集的时候也可以设置一下，这样每次得到的结果就是一样的了，有用的话麻烦给个采纳，谢谢
搞毕业论文是要求这个领域各个知识都懂吗 cnn 人工智能计算机视觉
2022-06-28 12:00

回答 3 已采纳不用啊，懂得多当然好，但主要是针对你的方向提出一些关键研究技术的idea，再尝试实现或者对原有的能够改进，并取得一些鲁棒性高的效果就很好了，不然就是论文写的又多又杂，单纯工作量大含金量不高;其他已有的
专家们这段程序为什么会出现这个报啊? 爬虫
2021-09-13 22:35

回答 1 已采纳类型错了，你拿到的pagetxt的类型与写文件的输入参数类型不一致
深度学习纯小白如何从零开始写第一篇论文？看完这篇豁然开朗！
2023-10-09 16:11

路人贾'ω'的博客全网最详细的深度学习论文写作攻略，上万字的含泪总结！小白写论文，看这一篇就够啦！
这个论文的运算符号代表什么含义机器学习深度学习
2023-03-20 19:53

回答 2 已采纳这个问题的回答你可以参考下: https://ask.csdn.net/questions/7579045
这个深度学习图像分割论文审稿意见怎么回复人工智能图像处理神经网络
2022-08-24 23:46

回答 5 已采纳怎么回复你就解释一下选择sigmoid函数的原因，还有实验过程中有没有权衡标准，是否有考虑过审稿意见中提到的idea，没有的话就如实回复会进一步改善，并将实验内容补充进去。
文章里用的一般是测试集结果还是验证集结果 keras python 神经网络
2022-08-24 10:00

回答 1 已采纳论文里面的是测试集。验证集和训练集是训练过程中使用的，测试集和训练集笼统上说都属于训练集，都是训练过程中使用的数据集。
人工智能：为什么很多机器学习和深度学习的论文复现不了？
2021-12-11 21:16

u013250861的博客然而，很多论文根本就复现不了，这是为什么呢？一、数据关系因为作者使用的数据比较私密，一般人拿不到，这种情况下，即使作者提供了源代码，但是读者却拿不到数据，也就没法复现算法。这种情况在国内学术界很...
免费论文查重网站哪家查重结果准确，freecheck和paperpass这两家如何？多彩生活
2021-09-07 10:42

回答 4 已采纳个人觉得freecheck更好一些，比较接近我们学校查重用着挺安全的
现在哪个领域适合研究生开题？人工智能 人工智能目标检测神经网络
2021-05-23 16:32

回答 1 已采纳我感觉这个要看你兴趣吧。如果都不是很感兴趣，那就选择你熟悉的领域，或者你身边的同学朋友导师熟悉的领域，这样的话上手比较快，也有人可以讨论和咨询。发论文的话看你要发什么档次的论文，一般的中文核心还是
yolov678为什么没有论文 pytorch 目标检测计算机视觉
2023-03-17 14:13

回答 3 已采纳除了v5和v8没论文，其他两个是有的：yolov6：https://arxiv.org/abs/2209.02976yolov7：https://arxiv.org/abs/2207.02696yol
这届百度AI究竟什么水平？
2019-12-22 10:41

喜欢打酱油的老鸟的博客 2019-12-16 14:16:41 乾明发自凹非寺量子位报道 | 公众号 QbitAI ...这家全球知名的第三方咨询机构，认为以AI为核心的“智能时代”正在迈步产业化阶段，而该阶段最迫切需求的，就是智能化平台。 ...
十分不解为什么这个div的文字爬不出来 python
2022-08-25 23:23

回答 3 已采纳你把extract()[0]等限制后缀删除看看
海外又曝出伪AI明星公司！人工智能是个巨大泡沫？
2019-08-16 10:19

Dimensionedu的博客昨日，《华尔街日报》曝光了一家印度伪AI明星公司Engineer.ai。这家总部设在美国洛杉矶和英国伦敦的公司，一直以来都声称：使用AI技术在很大程度上实现了移动App的自动化开发。在2018年11月，Engineer.ai对外宣布...
什么是人工智能？你需要知道的关于人工智能的一切
2020-03-21 11:40

半月夏微凉的博客 人工智能（Artificial Intelligence，AI）的执行指南讲述，从机器学习和通用人工智能到神经网络。什么是人工智能？这个问题取决于你问的对象是谁。早在20世纪50年代，这个领域之父Minsky和McCarthy就将人工智能...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

悬赏问题

¥15 react-diff-viewer组件，如何解决数据量过大卡顿问题
¥20 遥感植被物候指数空间分布图制作
¥15 安装了xlrd库但是import不了…
¥20 Github上传代码没有contribution和activity记录
¥20 SNETCracker
¥15 数学建模大赛交通流量控制
¥15 为什么我安装了open3d但是在调用的时候没有报错但是什么都没有发生呢
¥50 paddleocr最下面一行似乎无法识别
¥15 求某类社交网络数据集
¥15 靶向捕获探针方法/参考文献

测试结果只有原论文的一半这个是为什么？

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新