pytorch训练模型遇到的问题

I tensorflow/core/util/port.cc:113] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable TF_ENABLE_ONEDNN_OPTS=0.
WARNING:tensorflow:From C:\Users\Syang.conda\envs\pytorch\Lib\site-packages\keras\src\losses.py:2976: The name tf.losses.sparse_softmax_cross_entropy is deprecated. Please use tf.compat.v1.losses.sparse_softmax_cross_entropy instead.

pytorch里面怎么会一直弹TensorFlow的警告，而且查询了一下说的是
这个警告是由 TensorFlow 的一个版本更新引起的。在旧版本中，tf.losses.sparse_softmax_cross_entropy 是用于计算稀疏分类问题（标签为整数）的损失函数。然而，在新版本的 TensorFlow 中，这个函数已被标记为过时（deprecated），并建议使用 tf.compat.v1.losses.sparse_softmax_cross_entropy 替代。
tf.compat.v1 是 TensorFlow 提供的一个兼容性模块，用于向后兼容旧版本的代码。使用 tf.compat.v1.losses.sparse_softmax_cross_entropy 可以确保你的代码在新版本的 TensorFlow 中仍然能够正常运行。
在你提供的代码中，可能是因为 TensorFlow 的某个依赖库或其他相关代码使用了过时的函数 tf.losses.sparse_softmax_cross_entropy，从而触发了这个警告。
要解决这个警告，你可以将代码中的 tf.losses.sparse_softmax_cross_entropy 替换为 tf.compat.v1.losses.sparse_softmax_cross_entropy。这样可以确保你的代码在新版本的 TensorFlow 中继续正常运行，并避免警告信息的出现。

但是我并没有找到tf.losses.sparse_softmax_cross_entropy这一段代码
每训练一个epoch就会疯狂弹这个警告，严重影响训练速度

训练速度其实挺快的，但是会弹七八个警告之后才进入下一轮的训练

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
GISer Liu 2024-02-29 19:23
关注
该回答引用自GPT-3.5,由博主GISer Liu编写：

根据你的描述，问题是在使用PyTorch训练模型时，出现了来自TensorFlow的警告信息，具体是关于```
tf.losses.sparse_softmax_cross_entropy

解决这个问题的思路是要找到触发警告的代码，然后对其进行修改以消除警告。尽管你表示没有找到代码中使用了``` tf.losses.sparse_softmax_cross_entropy ```，但这个警告仍然持续出现，可能是因为某些第三方库或者其他依赖在内部使用了这个函数。为了解决这个问题，你可以尝试以下几个步骤： 1. **确认依赖库版本** ：确保你的环境中的TensorFlow版本是最新的，并且检查PyTorch及其相关依赖库的版本是否也是最新的。有时候更新依赖库版本可以解决兼容性问题。 2. **检查代码中的依赖** ：仔细检查你的代码以及可能使用的所有第三方库，确保没有地方在使用``` tf.losses.sparse_softmax_cross_entropy ```函数。 3. **尝试手动设置环境变量** ：根据警告信息提到的内容，尝试手动设置环境变量``` TF_ENABLE_ONEDNN_OPTS=0 ```，看看是否能够消除警告。你可以在代码中的开头添加以下代码来设置环境变量： pythonCopy code

import os
os.environ['TF_ENABLE_ONEDNN_OPTS'] = '0'

```
4. 查找第三方库中的问题 ：如果以上步骤都没有解决问题，可能是某些第三方库内部使用了过时的函数。你可以尝试查找你使用的所有库的GitHub或者其他平台上的issue，看看是否有其他人报告过类似的问题，并找到相应的解决方案。
5. 考虑更换环境 ：如果以上方法都无法解决问题，考虑更换开发环境或者重新安装所有依赖库。
综上所述，解决这个问题的关键是要找到代码中或者依赖库中触发警告的地方，并对其进行修改或者调整以消除警告。

如果该回答解决了您的问题，请采纳！如果没有，请参考以下方案进行修订
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Pytorch训练测试模型全流程超详细
2024-03-15 21:53

我不会深度学习的博客本文利用pytorch实现了图像分类的问题。...在前文中，我们下载了60000张已标注好的训练数据和10000张测试集，如下图现在，我们的数据以Pytorch数据集的形式存在；Dataloader将我们的数据集转换为Pytorch可迭代的对象；
PyTorch模型训练过程内存泄漏问题解决
2023-11-29 21:13

阳光素描的博客这里，self.data_list是dataset类中保存数据字典的列表，index是列表索引。在模型训练的全部过程中，都使用该字典进行...近日，在模型训练过程中，发现过一段时间后进程会被kill，观察发现是由于内存泄漏问题造成的。
在Ubuntu/Debian系统中使用docker容器搭建pytorch训练模型
2024-10-24 17:11

Miss.至的博客在Ubuntu/Debian系统中使用docker容器搭建pytorch训练模型
学深度学习一定要知道的——pytorch 预训练模型
2024-11-07 10:11

功城师的博客从零开始训练深度神经网络既耗费资源又消耗时间，不过好消息是 PyTorch 的预训练模型可以很好的解决这个问题，pytorch 可以提供已在大型数据集上学习到鲁棒特征的模型，让我们可以快速将这些模型适配到特定任务中，...
解决Pytorch训练过程中loss不下降的问题
2020-09-18 04:53

在使用Pytorch框架进行神经网络的训练过程中，我们可能会遇到loss不下降的问题。这种情况可能会让初学者感到困惑，甚至认为是模型本身存在问题。但实际上，loss不下降的原因可能多种多样，包括但不限于以下几个方面...
pytorch 预训练模型
2024-11-07 09:14

顺其自然~的博客有时，我们可能希望超越默认值，并加载具有自定义权重的模型。如果在独特的数据集上进行了训练，或者正在使用 torchvision 中未直接提供的模型，这将特别有用。
基于 clip-pytorch 模型，可训练个人数据集
2025-08-19 06:41

此外，PyTorch的社区支持和丰富的文档资源也为用户在训练过程中遇到的各种问题提供了有效的解决方案。在实际应用中，训练个人数据集的意义重大。例如，在一些特定领域，如医疗影像分析、农业害虫监测、智能家居...
pytorch训练模型常见错误（图像）
2022-07-05 15:18

OnTheOurWay的博客 pytorch训练图像模型常见错误
pytorch训练模型遇到的问题
2021-10-22 16:24

qq_33343450的博客 pytorch训练模型遇到的问题1、AttributeError: 'DataParallel' object has no attribute 'fc'2、TypeError: zip argument #122 must support iteration 1、AttributeError: ‘DataParallel’ object has no ...
一文了解 | 用PyTorch训练大语言模型
2024-12-20 17:59

大模型微调部署的博客解除了以上误区，如果你又对大语言...使用 PyTorch 训练大语言模型可以让用户快速地开发和部署高质量的语言模型，获得高效的计算资源、灵活的模型设计、快速的模型训练和推理，PyTorch就是研究和开发 LLM 的理想选择。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月29日

pytorch训练模型遇到的问题

3条回答 默认 最新

问题事件

3条回答默认最新