用自写的loss计算很慢的问题

背景：一个图像预测任务，图像并不是指常见的jpg等格式的图片，其实就是网格内每个像素点有数值的那种类似于热点图的图像，如下图

问题：如上图所示，一张图里其实有很大一片区域是0值。但搭的网络输入输出是整图，维度为（32，224，224）。最近意识到计算loss不可以将整图放入计算，只想要关注body内有值的区域，所以就用上自写的loss function，出现了计算极其缓慢的现象。
——
train预测过程：x为输入，y为GT，y_pred为预测结果，b是与y维度相同的、只有0或1的mask，b==1就是body内区域。我的做法是把b展平成一维，再用np.where读取b==1的坐标到BODY，同时y，y_pred也展平成一维。放入自写的smooth_L1计算loss

        x = np.array(inputList)
        y = np.array(labelList)
        b = np.array(bodyList)
        b = b.flatten()
        BODY = np.where(b == 1)
        BODY = np.array(BODY)
        BODY = BODY.flatten()
        x = np.float32(x)
        y = np.float32(y)
        x = torch.tensor(x)
        y = torch.tensor(y)
        BODY = torch.tensor(BODY)
        x = x.to(device)
        y = y.to(device)
        BODY = BODY.to(device)
        optimizer.zero_grad()
        y_pred = model(x)
        y_pred = y_pred.view(-1)
        y = y.view(-1)
        train_loss = smooth_l1(y_pred, y, BODY)
        print(f"第 {t + 1}/{epoch} epoch, 第 {i + 1}/{batch_train} batch, train_loss: {train_loss.item()}")
        train_loss.backward()
        optimizer.step()

自写的loss：就是一个smoothL1 Loss，但是我只想计算body内区域。所以用了一个for循环读取mask里（也就是BODY里）存好的坐标。

# 定义损失函数
def smooth_item(x, beta):
    if x < beta:
        loss_item = (0.5*torch.square(x))/beta
    else:
        loss_item = x-0.5*beta
    return loss_item
def smooth_l1(y_pred, y, mask, beta=1):
    n = len(mask)
    loss = 0
    for i in mask:
        loss += smooth_item(torch.abs(y_pred[i]-y[i]), beta)
    return loss/n

debug发现这样子计算loss好慢好慢，有什么方法优化吗？要说用GPU加速，但这样子一个个坐标读取再累加也不是一个并行过程呀

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-03-01 11:10
关注
参考GPT和自己的思路，您可以尝试使用torch.where()函数，而不是用np.where()函数，这可以使您在GPU上并行化处理，从而提高您的计算速度。具体来说，您可以使用torch.where()函数来创建一个bool类型的掩码张量，该张量的形状与输入张量相同，但是只有掩码中的值为True时，才会计算损失。这样就不必将掩码扁平化并使用for循环逐个读取坐标，而是可以使用张量的广播机制，使每个掩码元素与相应的预测值和目标值相匹配，从而并行计算损失。

下面是使用torch.where()函数修改您的smooth_l1函数的示例：

def smooth_l1(y_pred, y, mask, beta=1): loss_item = torch.abs(y_pred - y) loss_item = torch.where(loss_item < beta, 0.5 * torch.pow(loss_item, 2) / beta, loss_item - 0.5 * beta) loss = torch.sum(loss_item * mask) / torch.sum(mask) return loss

在这个版本的smooth_l1函数中，我们首先计算了预测值与目标值之间的差异，然后使用torch.where()函数来计算smooth L1损失。最后，我们将掩码应用于损失，并在返回之前求出平均值。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

用自写的loss计算很慢的问题 python 图像处理深度学习
2023-03-01 11:06

回答 4 已采纳参考GPT和自己的思路，您可以尝试使用torch.where()函数，而不是用np.where()函数，这可以使您在GPU上并行化处理，从而提高您的计算速度。具体来说，您可以使用torch.where
关于#深度学习知识蒸馏算法loss函数计算#的问题？ python 人工智能深度学习
2022-08-12 14:57

回答 1 已采纳原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好
R语言报错optim无法在初始值计算函数 r语言
2022-07-08 10:32

回答 1 已采纳这样，在初始设置参数的时候的b0，不要都设成0，变成这样c(0,0,0,0,1)试一下
脑语言v0.5.8 2500令【单字编程】
2022-07-11 06:55

脑语言的博客这是脑语言v0.5.8版的2500个单字（也称为“令”与“一令”），通过【单字编程】（并不仅是中文编程，而是混合英文关键字，但以单字为主的命名）也许是英文不太好时又希望能写代码的其中一种方式。我在做脑语言...
acc，loss，miou三个曲线不太理想的问题 pytorch 目标检测计算机视觉
2022-07-16 10:25

回答 2 已采纳可以试试动态调整学习率，batch_size可以调，也可以调整下训练集测试集比例，设置每次保存最优模型等
Ceph读写性能问题，读入快，写出慢云计算
2023-02-02 14:40

回答 3 已采纳 1.增加OSD数量：在Ceph中，增加OSD数量可以提高写性能。2.提高内存配置：Ceph需要充足的内存来维护元数据和缓存，因此提高内存配置可以提高写性能。3.提高网络带宽：Ceph是一个网络存储系统
Python编程语言中:f的含义 python 开发语言
2021-11-05 17:43

回答 3 已采纳 f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符.具体函数可以参考看
计算摄影：基于深度学习的畸变校正
2021-12-01 07:00

3Ｄ视觉工坊的博客点击上方“3D视觉工坊”，选择“星标”干货第一时间送达在手机中的计算摄影4-超广角畸变校正中，我为你描述了广角镜头的镜头畸变校正和透视畸变校正，尤其是花了很多篇幅讲述施易昌等人的论文如何校...
yolov5识别图像的FPS计算问题深度学习计算机视觉
2022-04-28 18:15

回答 2 已采纳 pre-process：图像预处理时间，包括图像保持长宽比缩放和padding填充，通道变换（HWC->CHW）和升维处理等ms inference：推理速度，指预处理之后的图像输入模型到模型输
yolov5验证loss比训练loss大很多 python 深度学习目标检测
2022-06-22 10:51

回答 3 已采纳不是，你这个是class_loss一塌糊涂导致你的pr和map曲线也不行，但是你的obj和box是正常的，也就是说网络有找到目标，只不过目标在分类的时候分错了。首先考虑的应该是你的数据集情况。1.你的
原形网络的acc、loss计算 python pytorch
2023-03-28 23:14

回答 2 已采纳基于Monster 组和GPT的调写：不是用来计算 acc 和 loss 的，而是来设置训练过程中的日志记录和实验结果保存的参数 parser.add_argument() 用来添加命令行参数，用于控
python神经网络编程豆瓣,Python神经网络训练很慢
2022-10-24 10:35

小六oO的博客然后推广到简单的神经...其次至少需要具备一些适用于研究的编程语言的技能，例如python，matlab，（C++也可行）等，哪怕不自己实现最简单的神经网络而是用API，也是需要一定计算机能力才能应用之。#Dense就是隐藏层。
loss.backward()反向传播问题 python
2023-04-06 09:51

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客: RuntimeError: one of the variables needed for gradient computation
生成模型在计算机视觉、自然语言处理、推荐系统中的应用和研究
2023-08-07 00:34

禅与计算机程序设计艺术的博客从传统的统计学习到深度学习（如卷积神经网络CNN），人工智能技术不断的进步，已经引起了很大的社会影响。在这个过程中，生成模型是一个非常重要的工具，它可以用来帮助理解复杂的数据集。通过训练一个生成模型，...
使用开源概率编程语言 Pyro 对截尾时间 - 事件数据进行建模
2019-06-08 13:44

编程鸭的博客他们的第 2 次乘坐是个关键指标，表明乘客在使用平台的过程中发现价值并愿意长期使用我们服务。然而，对第 2 次乘坐时间建模是件棘手的事。例如，一些乘客不经常乘车。在分析这类乘客的第 2 次乘坐之前的时间 - 事件...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月1日

悬赏问题

¥15 R语言Rstudio突然无法启动
¥15 关于#matlab#的问题：提取2个图像的变量作为另外一个图像像元的移动量，计算新的位置创建新的图像并提取第二个图像的变量到新的图像
¥15 改算法，照着压缩包里边，参考其他代码封装的格式写到main函数里
¥15 用windows做服务的同志有吗
¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值

用自写的loss计算很慢的问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新