模型训练中，model size和inference time有联系吗？

在我们的固有观念里面认为model size越大inference time随之变大

但在近期做试验的过程中发现U2-Net†仅有4MB，但inference time有371

而U-NET有7MB，inference time为58

batch size同为12，同GPU，服务器未运行其他任何程序。

所以两者是否真的有联系？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

GitCode 官方企业官方账号 2021-05-10 17:47

关注

其实算inference time比较复杂吧，这里简单提两个要注意的点: asynchronous execution and GPU warm up

具体细节可以看下这篇文章: https://towardsdatascience.com/the-correct-way-to-measure-inference-time-of-deep-neural-networks-304a54e5187f

下面上一份pytorch算inference time的代码:

import torch
import numpy as np
import torchvision.models as models

model = models.vgg16()
device = torch.device("cuda")
model.to(device)
model.eval()
dummy_input = torch.randn(1, 3, 224, 224, dtype = torch.float).to(device)
starter, ender = torch.cuda.Event(enable_timing = True), torch.cuda.Event(enable_timing = True)
repetitions = 300
timings = np.zeros((repetitions, 1))
#GPU-WARM-UP
for _ in range(10):
   _ = model(dummy_input)
# MEASURE PERFORMANCE
with torch.no_grad():
  for rep in range(repetitions):
     starter.record()
     _ = model(dummy_input)
     ender.record()
     # WAIT FOR GPU SYNC
     torch.cuda.synchronize()
     curr_time = starter.elapsed_time(ender)
     timings[rep] = curr_time
mean_syn = np.sum(timings) / repetitions
std_syn = np.std(timings)
print(mean_syn)
print(std_syn)

报告相同问题？

关注问题

深度学习推理时间（Inference time）计算问题深度学习
2022-11-22 00:41

回答 2 已采纳推理的时候跟epoch无关，epoch是训练阶段的。计算推理时间是在训练结束之后的事情，目前看情况，主流的有1个或者32个batch size的推理时间，不包含图像预处理（包括转到cuda）和后处理，
机器学习中什么是推断？和聚类、回归这些术语有什么关系？人工智能机器学习
2022-02-04 17:06

回答 1 已采纳推断是根据已知随机变量求未知随机变量条件分布的过程，例如我从一段语音推断对应的文字。预测是推断的一种，其已知变量、未知变量具有因果关系，分类、回归都属于预测问题。
PYTHON笑脸检测模型训练失败 python 深度学习
2023-02-19 16:41

回答 1 已采纳该回答引用ChatGPT 根据错误信息显示，错误出现在 binary_crossentropy/mul_1 这个节点上，可能是因为输出的张量和期望的张量形状不匹配。错误信息中还提到了张量的形状信息
【ChatGPT模型精调训练】AI 大模型精调 Fine-Tuning （微调）训练图文代码实战详解
2024-03-09 11:39

禅与计算机程序设计艺术的博客选择预训练模型：选择一个在类似任务上已经训练好的模型作为起点。数据准备：准备并预处理你的数据集，使其适合模型的输入格式。微调：在你的特定数据集上继续训练模型，调整模型的权重。评估：评估微调后模型的性能...
如何在Golang中的文本上执行DL-RNN模型？ nlp rnn tensorflow
2017-11-06 17:58

回答 1 已采纳 You can use tfgo to easily load into Go and use a trained tensorflow model: just export the traine
训练AlexNet模型到一半时报错 python tensorflow
2022-12-24 08:57

回答 3 已采纳已解决，参考：http://t.csdn.cn/kSBa1可能是批量下载时出的问题，检查出错误图片并删除就行。（错误图片在电脑里可以正常打开查看，所以需要用代码检查）
保存使用keras训练的TF模型，然后在Go中进行评估 keras python tensorflow
2017-09-22 14:20

回答 1 已采纳 Your code should work fine. You're right about the cause of the nil-operation. You just have to f
Towards Accurate Latency Prediction of Deep-Learning Model Inference on Diverse Edge Devices
2023-11-21 23:43

Yongqiang Cheng的博客 nn-Meter: Towards Accurate Latency Prediction of Deep-Learning Model Inference on Diverse Edge Devices nn-Meter：精准预测深度学习模型在边缘设备上的推理延迟
如何将jetson-inference安装到虚拟环境 c语言人工智能
2021-04-21 12:28

回答 1 已采纳我找到了，要建立软链接 cd ~/.virtualenvs/虚拟环境名/lib/python3.6/site-packages/ ln -s /usr/lib/python3.6/dist-pa
cnn只加载了神经神经网络，还没开始训练，12G显存就占了12G，怎么回事？ python 人工智能机器学习
2021-04-14 14:56

回答 2 已采纳 Keras默认会占满显存的。下列代码是动态使用，也就是按需分配的： import keras.backend.tensorflow_backend as KTF import tensorflow
深度学习测试时，加载模型出问题。 python 人工智能深度学习
2021-07-30 16:55

回答 2 已采纳 ckp和模型的维度数目不匹配，具体的你可以看看这个看下能不能改https://blog.csdn.net/qq_45128278/article/details/116588153
【自然语言处理】【分布式训练及推理】推理工具DeepSpeed-Inference
2023-01-28 16:51

BQW_的博客推理工具DeepSpeed-Inference ...DeepSpeed提供了无缝推理模式来兼容DeepSpeed、Megatron和HuggingFace训练的Transformer模型。DeepSpeed-Inference集成了模型并行技术，从而使得可以在多个GPU上进行大模型的推理。
如何将YOLOv5中的NMS替换成DIOU NMS? python 有问必答深度学习神经网络
2021-04-13 13:54

回答 10 已采纳 https://github.com/Zzh-tju/yolov5 参考下这个有对比的图 u版本的默认GIOU
模型融合model fusion与模型聚合model ensemble：提升机器学习性能的艺术
2024-03-29 11:08

诸神缄默不语的博客本文介绍模型融合model fusion与模型聚合model ensemble：提升机器学习性能的艺术
[LLM]大模型训练DeepSpeed(一)-原理介绍
2023-05-17 18:51

舒克与贝克的博客 DeepSpeed是由Microsoft提供的分布式训练工具，旨在支持更大规模的模型和提供更多的优化策略和工具。与其他框架相比，DeepSpeed支持更大规模的模型和提供更多的优化策略和工具。其中，主要优势在于支持更大规模的...
没有解决我的问题, 去提问

悬赏问题

¥15 Python输入字符串转化为列表排序具体见图，严格按照输入
¥20 XP系统在重新启动后进不去桌面，一直黑屏。
¥15 opencv图像处理，需要四个处理结果图
¥15 无线移动边缘计算系统中的系统模型
¥15 深度学习中的画图问题
¥15 java报错:使用mybatis plus查询一个只返回一条数据的sql，却报错返回了1000多条
¥15 Python报错怎么解决
¥15 simulink如何调用DLL文件
¥15 关于用pyqt6的项目开发该怎么把前段后端和业务层分离
¥30 线性代数的问题，我真的忘了线代的知识了

码龄粉丝数原力等级 --

模型训练中，model size和inference time有联系吗？

2条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

模型训练中，model size和inference time有联系吗？

2条回答 默认 最新

悬赏问题

2条回答默认最新