关于#tensorflow#的问题：学习率等都一样的情况下，模型到达一定的深度时，而自定义学习loss完全不变(语言-python)

在优化器，学习率等都一样的情况下，模型到达一定的深度时，fit正常使用，而自定义学习loss完全不变，一点都不学习。在模型比较小的时候就挺正常的。这是为什么呢？ fit有什么隐藏的自动调节手段吗

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
herosunly 优质创作者: python技术领域 2022-08-07 06:57
关注
看了下代码，model.fit()是默认使用batch_size=32的小批量学习，而tf.GradientTape是默认使用所有训练集进行训练。而且model.fit()在每次迭代时会对数据进行打乱(shuffle)。batch_size代码你可以根据下面的源码稍微改一下：

for x_batch, y_batch in tf.data.Dataset.from_tensor_slices((X, y_true)).batch(32): with tf.GradientTape() as tape: y = model(x_batch, training=True) loss_value = loss_fun(y_batch, y) grads = tape.gradient(loss_value, model.trainable_variables) opt_g.apply_gradients(zip(grads, model.trainable_variables))
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

tensorflow_source:深度学习tensorflow入门，原理与进阶源代码
2021-03-23 15:58

TensorFlow 是一个强大的开源机器学习库，由 Google Brain 团队开发，用于各种人工智能任务，如图像识别、自然语言处理和推荐系统等。这个压缩包文件 "tensorflow_source" 提供了 TensorFlow 的源代码，旨在帮助...
深度学习知识点全面总结
2022-01-05 16:29

GoAI的博客本文详细介绍深度学习概念及原理，参考网上相关资料汇总，内容包含众多章节，包括神经网络基础及常见深度学习网络结构介绍，用于个人学习总结，适合深度学习初学者学习。同时介绍机器学习常见的分类算法：SVM、神经...
深度学习笔记（五）——网络优化（1）：学习率自调整、激活函数、损失函数、正则化
2024-01-13 22:34

絮沫的博客本文介绍了神经网络优化中的学习率调整策略，常见激活函数，并手写实现激活函数。同时介绍了两种重要的算是函数和正则化方法。
【Tensorflow+Keras】学习率指数、分段、逆时间、多项式衰减及自定义学习率衰减的完整实例
2021-10-04 10:54

Better Bench的博客【Tensorflow+Keras】学习率指数、分段、逆时间、多项式衰减及自定义学习率衰减的实现及完整实例 1 引言 Keras提供了四种衰减策略分别是ExponentialDecay(指数衰减), PiecewiseConstantDecay(分段常数衰减) , ...
0基础深度学习项目12：基于TensorFlow实现彩色图片分类
2024-08-13 14:39

浪荡公子_2的博客本文为365天深度学习训练营中的学习记录博客原作者：K同学啊目录一、创建环境二、前期准备 2.1 设置GPU 2.2 导入数据 2.2.1 在TensorFlow框架中导入CIFAR-10数据集 2.2.2 数据归一化 2.3数据可视化三、构建...
深度学习与大数据结合：TensorFlow on Spark 实现图像分类模型的分布式训练
2025-11-01 22:19

2501_93892011的博客使用 TensorFlow 定义 CNN 模型。图像分类常用架构如 ResNet 或自定义 CNN。模型结构：输入层 -> 卷积层 -> 池化层 -> 全连接层 -> 输出层（Softmax）。数学表示：卷积操作使用 $W \ast X + b$，其中 $W$ 是滤波器...
深度学习与TensorFlow核心技巧解析
2025-09-16 04:12

咖啡因依赖的博客本文涵盖TensorFlow核心特性、与NumPy的区别、数据结构、自定义层与模型、损失函数和指标的实现方式、动态模型、TFRecords、迁移学习、RNN架构、序列建模等内容。重点介绍了在训练模型时如何优化性能、处理数据以及...
【算法底座研究室】AI 高手之路 15：TensorFlow/Keras 入门——构建你的第一个深度学习模型
2025-03-25 19:15

Mr-PI的博客在人工智能浪潮席卷全球的今天，深度学习无疑是最耀眼的明星。它驱动着图像识别、自然语言处理...我希望通过这篇文章，带你走进深度学习的世界，用TensorFlow和Keras构建你的第一个深度学习模型，开启你的AI探索之旅。
深度学习-TensorFlow2：TensorFlow2 创建CNN神经网络模型【ResNet模型】
2021-02-20 21:33

u013250861的博客 自定义ResNet神经网络-Tensorflow【cifar100分类数据集】 import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # 放在 import tensorflow as tf 之前才有效 import tensorflow as tf from tensorflow import ...
深度学习-TensorFlow2 ：构建DNN神经网络模型【构建方式：自定义函数、keras.Sequential、Compile&Fit、自定义Layer、自定义Model】
2021-01-12 23:07

u013250861的博客人工智能-深度学习-TensorFlow2 ：TensorFlow2 创建DNN神经网络模型【自定义函数、keras.Sequential、Compile&Fit、自定义Layer、自定义Model】
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月7日

关于#tensorflow#的问题：学习率等都一样的情况下，模型到达一定的深度时，而自定义学习loss完全不变(语言-python)

4条回答 默认 最新

问题事件

4条回答默认最新