困困的晴啊 2025-07-28 11:34 采纳率: 0%

RUAS算法NAN报错

RUAS低光增强代码复现，只更换了数据集，运行train.py，但在第150step的时候就nan了
2025-07-26 04:48:35,653 gpu device = 2
2025-07-26 04:48:35,653 args = Namespace(batch_size=1, gpu=2, report_freq=50, seed=2)
2025-07-26 05:19:09,974 train 050 0.332135 0.010473
2025-07-26 05:19:12,571 train 100 0.261804 0.003910
2025-07-26 05:19:15,217 train 150 0.374308 inf
2025-07-26 05:19:17,864 train 200 nan nan
2025-07-26 05:19:20,476 train 250 nan nan
2025-07-26 05:19:23,128 train 300 nan nan
2025-07-26 05:19:25,754 train 350 nan nan
2025-07-26 05:19:28,275 train 400 nan nan
2025-07-26 05:19:31,051 train 450 nan nan
2025-07-26 05:19:33,840 train 500 nan nan
2025-07-26 05:19:36,497 train 550 nan nan
2025-07-26 05:19:39,260 train 600 nan nan
2025-07-26 05:19:42,074 train 650 nan nan
2025-07-26 05:19:44,842 train 700 nan nan
2025-07-26 05:19:47,501 train 750 nan nan
2025-07-26 05:19:50,135 train 800 nan nan

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-07-28 11:35
关注
上午好☀️☀️☀️️
本答案参考通义千问

在使用 RUAS（Recurrent Unsupervised Attention System） 算法进行低光增强代码复现时，遇到 NAN 报错 是一个常见的问题。根据你提供的日志信息，可以看到训练在第 150 步后出现了 inf 和 nan，说明模型的损失值或梯度中出现了异常数值。

可能的原因分析

1. 数据输入异常

数据集中存在 无效图像 或 全黑/全白图像。
图像尺寸不一致或格式错误，导致模型无法处理。

2. 学习率设置过高

如果学习率过大，可能导致梯度爆炸（Gradient Explosion），从而产生 inf 或 nan。

3. 模型结构不稳定

某些层（如卷积、残差块等）设计不当，容易引发数值溢出。
使用了 Sigmoid 或 Softmax 等激活函数，若输入值过大也可能导致 inf。

4. 权重初始化不当

权重初始化不规范，可能导致某些层输出过大。

5. 正则化不足

缺乏梯度裁剪（Gradient Clipping）或权重衰减（Weight Decay），导致梯度爆炸。

解决方案

以下是针对上述问题的详细解决步骤：

1. 检查并清洗数据集

重点：确保所有图像都是有效的，并且尺寸一致。

import cv2 import os def is_valid_image(path): try: img = cv2.imread(path) if img is None or img.size == 0: return False return True except Exception as e: print(f"Error reading image {path}: {e}") return False # 遍历数据集目录，过滤掉无效图像 valid_files = [f for f in os.listdir("your_dataset_path") if is_valid_image(os.path.join("your_dataset_path", f))]

建议：在训练前对图像进行归一化处理（如 0~1 范围）。

2. 调整学习率和优化器配置

重点：降低学习率，防止梯度爆炸。

# 原始学习率 # optimizer = torch.optim.Adam(model.parameters(), lr=1e-4) # 修改后的学习率（可尝试 1e-5） optimizer = torch.optim.Adam(model.parameters(), lr=1e-5)

建议：可以使用 torch.optim.lr_scheduler 动态调整学习率。

3. 添加梯度裁剪（Gradient Clipping）

重点：防止梯度爆炸。

from torch.nn.utils import clip_grad_norm_ # 在每次反向传播后添加梯度裁剪 clip_value = 1.0 clip_grad_norm_(model.parameters(), clip_value)

4. 检查模型结构中的潜在问题

重点：避免使用可能导致数值不稳定的操作（如 Sigmoid、Softmax）。

例如，检查是否在最后的输出层使用了 sigmoid：

# 不推荐： output = torch.sigmoid(output) # 推荐（如果使用 BCEWithLogitsLoss）： output = output # 不加激活函数

5. 添加权重初始化策略

重点：使用标准初始化方法（如 Kaiming、Xavier）。

def weights_init(m): if isinstance(m, nn.Conv2d): nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu') if m.bias is not None: nn.init.constant_(m.bias, 0) elif isinstance(m, nn.BatchNorm2d): nn.init.constant_(m.weight, 1) nn.init.constant_(m.bias, 0) model.apply(weights_init)

6. 添加日志监控和调试

重点：实时监控损失值、梯度、参数范围。

import torch def log_gradient_norm(model): total_norm = 0 for p in model.parameters(): if p.grad is not None: param_norm = p.grad.data.norm(2) total_norm += param_norm.item() ** 2 total_norm = total_norm ** (1. / 2) print(f"Gradient norm: {total_norm}") # 在训练循环中调用 log_gradient_norm(model)

总结

| 问题 | 解决方案 | |------|----------| | 数据异常 | 清洗数据，确保图像有效 | | 学习率过高 | 降低学习率，使用动态调整 | | 梯度爆炸 | 添加梯度裁剪 | | 模型结构问题 | 检查激活函数和输出层 | | 权重初始化 | 使用 Kaiming/Xavier 初始化 | | 调试困难 | 添加日志监控，观察梯度和参数变化 |

如果你能提供 部分代码片段（如训练循环、模型定义等），我可以进一步帮你定位具体问题所在。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

弱光图像六大增强算法，一站式解决论文实验比较部分
2024-01-09 09:39

EnlightenGAN, RUAS, SCI, URetinex-Net, Zero-DCE, Zero-Dce++六大算法综合的可执行程序。具体请参考本程序的同名文章：《弱光图像增强算法(6大算法附程序)，一站式解决论文实验比较部分》。这篇文章里有如何使用。...
ruas-sp:P-cadastro Ruas SP
2021-03-10 07:53

Copie o arquivo .env.example para .env随环境变量（ local / staging / prod ）的变化与服务对象的特定性（cri um banco de dados exclusivo paraaplicação）一致 Na pasta do projeto，像dependênciasdo ...
RUAS论文阅读笔记
2023-04-14 20:30

ssf-yasuo的博客 RUAS论文阅读笔记
Ultra-High-Definition Low-Light Image Enhancement: A Benchmark andTransformer-Based Method
2024-03-14 11:09

Adagrad的博客我们进行系统的基准测试研究并提供当前 LLIE 算法的比较。作为第二个贡献，我们引入了 LLFormer，一种基于 Transformer 的低光增强方法。LLFormer的核心组件是基于轴的多头自注意力和跨层注意力融合块，显着降低了...
NASA:水瓶座官方发布第 3 级辅助雷诺海面温度标准映射图像升月气候学数据 V5.0
2024-07-28 08:30

此星光明的博客它们只是雷诺兹国家气候数据中心（NCDC）0.25 度数据集中的日海面温度数据，使用水瓶座处理 L2-L3 处理方案对其进行网格化和平均化处理，达到与水瓶座 L3 级标准盐度和风速产品相同的 1 度空间分辨率以及日、7 天、...
【WWW2021】图神经网络的知识提取与超越：一个有效的知识蒸馏框架
2021-03-20 00:44

zenRRan的博客算法每次迭代（算法1的第3行到第13行）的时间复杂度和空间复杂度都是，这和数据集的规模线性相关。事实上，操作可以简单写成矩阵形式，对于真实数据集的训练过程，使用单GPU可以在几秒内完成。因此，我们提出的...
区块链的分类与地址长度
2022-02-08 00:45

sanqima的博客地址长度为62 Elrond的地址长度为62 链类型地址 Elrond erd1ss6u80ruas2phpmr82r42xnkd6rxy40g9jl69frppl4qez9w2jpsqj8x97 Elrond erd1krpvw5rhly0qvq2d5z4juasn7t2an6k2p0pv529w822k2m05uufstgt2ee 2.2) 地址长度...
【图像增强（Image Enhancement ）】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、关于答疑、文章目录、与我联系等（持续更新中...）
2025-07-29 12:45

十小大的博客【论文精读】与【论文复现】论文精读：读懂论文，总结提炼，聚焦核心内容，不只是全文翻译论文复现：跑通流程，源码解析，提升代码能力，得到去噪结果以及指标计算综合而言，从大到小拆解模型结构，从小到大实现模型...
【论文笔记】—低照度图像增强—ZeroShot—RUAS网络—2021-CVPR
2022-05-14 22:18

chaiky的博客本文提出了一个新的原则性框架，通过注入弱光图像的知识和搜索轻量级的优先架构，为现实场景中的微光图像构建轻量级但有效的增强网络，命名为RUAS。.................................................................
【ECCV 2024】低光增强论文Retinexformer论文解读与源码解析---part1 网络结构解析
2025-05-11 17:26

BOB_BOB_BOB_的博客【ECCV 2024】 Retinexformer 网络结构解析与代码解析本文分析2024 NTIRE 低光增强亚军开源论文与代码 part1 论文分析
项目快过（ Self-Calibrated Illumination）Toward Fast, Flexible, and Robust Low-Light Image Enhancement
2024-07-14 17:16

万里鹏程转瞬至的博客算法效果 1.1 指标效果 SCI方法作为无监督方法与传统算法与有监督方法取得了可竞争的效果，尤其是在MIT数据集上，表现了领先效果。在速度上可以看出SCI方法是极快的档次，1.7ms即可完成一个图片，fps在600左右。...
【图像增强】论文精读：DarkIR: Robust Low-Light Image Restoration
2025-07-30 12:12

十小大的博客实验表明，DarkIR在LOLBlur、LOLV2和Real-LOLBlur数据集上达到SOTA性能，PSNR比LEDNet提升1dB，并能泛化到真实夜间图像。该方法创新性地结合空间域和频域处理：空间域通过大感受野注意力解决噪声和模糊，频域利用...
TPAMI 2025 | 噪声自回归：一种无需任务相关数据的新学习范式用于低光图像增强
2025-04-16 09:30

小白学视觉的博客从训练数据的角度来看，现有方法主要通过以下三种数据类型之一来完成LLIE任务：配对数据、非配对数据和无参考数据。每种数据驱动的方法都有其独特的优势，例如，基于无参考数据的方法对训练数据的要求非常低，能够在...
【图像增强】论文精读：R2RNet: Low-light Image Enhancement via Real-low to Real-normal Network
2025-08-07 16:17

十小大的博客作者还构建了首个大规模真实世界配对低光/正常光数据集LSRW，解决了现有合成数据泛化性差的问题。实验表明，该方法在公共数据集上定量和定性均优于现有技术，并能有效提升后续视觉任务（如人脸检测）的性能。
【图像增强】论文精读：Low-Light Image Enhancement with Illumination-Aware Gamma Correction and Complete Image M
2025-08-11 14:09

十小大的博客基于光照感知伽马校正和完整图像建模网络的微光图像增强论文源码：无ICCV 2023本文提出了一种新的具有光照感知伽马校正和完整图像建模的网络结构来解决微光图像增强问题。弱光环境通常会导致信息量较少的大规模黑暗...
access的查询导致长文本数据缺失,为什么长文本字段在MS ACCESS 2013查询中仅返回255个字符？...
2020-12-19 17:31

马宇宸的博客 Está a poucos metros do Baixo Copacabana, encontro das ruas Domingos Ferreira, Aires Saldanha e Bolívar. É neste local que fica uma das maiores concentrações de bares de Copacabana, onde ...
analysis3_lab:课程实验室分析3
2021-03-19 19:31

2. 数据文件：可能包含用于分析或建模的数据集，通常以.csv或其他数据格式存储。 3. 说明文档：可能是.md或.html文件，提供课程背景、目标和步骤的详细说明。 4. 示例代码：可能包含.py文件，展示如何在Python中实现...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月28日

码龄粉丝数原力等级 --

RUAS算法NAN报错

5条回答默认最新

码龄粉丝数原力等级 --

可能的原因分析

1. 数据输入异常

2. 学习率设置过高

3. 模型结构不稳定

4. 权重初始化不当

5. 正则化不足

解决方案

1. 检查并清洗数据集

2. 调整学习率和优化器配置

3. 添加梯度裁剪（Gradient Clipping）

4. 检查模型结构中的潜在问题

5. 添加权重初始化策略

6. 添加日志监控和调试

总结

问题事件

码龄粉丝数原力等级 --

RUAS算法NAN报错

5条回答 默认 最新

可能的原因分析

1. 数据输入异常

2. 学习率设置过高

3. 模型结构不稳定

4. 权重初始化不当

5. 正则化不足

解决方案

1. 检查并清洗数据集

2. 调整学习率和优化器配置

3. 添加梯度裁剪（Gradient Clipping）

4. 检查模型结构中的潜在问题

5. 添加权重初始化策略

6. 添加日志监控和调试

总结

问题事件

5条回答默认最新