[Tensorflow 2.5.0]ValueError: No gradients provided for any variable

问题遇到的现象和发生背景

第一次使用Tensorflow, 这是我在GitHub上找的一个项目，这个项目原本用TensorFlow 1.x的写法来写的，我用TensorFlow 2.x的写法仿造一些示例代码来改写，训练过程中遇到所提到的这个错误。

运行结果及报错内容

Traceback (most recent call last):
  File "train.py", line 78, in <module>
    train(model)
  File "train.py", line 24, in train
    model.optimize()
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/def_function.py", line 889, in __call__
    result = self._call(*args, **kwds)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/def_function.py", line 933, in _call
    self._initialize(args, kwds, add_initializers_to=initializers)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/def_function.py", line 763, in _initialize
    self._stateful_fn._get_concrete_function_internal_garbage_collected(  # pylint: disable=protected-access
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/function.py", line 3050, in _get_concrete_function_internal_garbage_collected
    graph_function, _ = self._maybe_define_function(args, kwargs)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/function.py", line 3444, in _maybe_define_function
    graph_function = self._create_graph_function(args, kwargs)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/function.py", line 3279, in _create_graph_function
    func_graph_module.func_graph_from_py_func(
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/framework/func_graph.py", line 999, in func_graph_from_py_func
    func_outputs = python_func(*func_args, **func_kwargs)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/def_function.py", line 672, in wrapped_fn
    out = weak_wrapped_fn().__wrapped__(*args, **kwds)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/eager/function.py", line 3971, in bound_method_wrapper
    return wrapped_fn(*args, **kwargs)
  File "/root/miniconda3/lib/python3.8/site-packages/tensorflow/python/framework/func_graph.py", line 986, in wrapper
    raise e.ag_error_metadata.to_exception(e)
ValueError: in user code:

    /root/autodl-tmp/HyperBox-main/script/model_v2/box_model.py:328 optimize  *
        self.create_optimizer()
    /root/autodl-tmp/HyperBox-main/script/model_v2/box_model.py:139 create_optimizer  *
        self.optimizer = tf.keras.optimizers.Adam(
    /root/miniconda3/lib/python3.8/site-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:530 minimize  **
        return self.apply_gradients(grads_and_vars, name=name)
    /root/miniconda3/lib/python3.8/site-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:630 apply_gradients
        grads_and_vars = optimizer_utils.filter_empty_gradients(grads_and_vars)
    /root/miniconda3/lib/python3.8/site-packages/tensorflow/python/keras/optimizer_v2/utils.py:75 filter_empty_gradients
        raise ValueError("No gradients provided for any variable: %s." %

    ValueError: No gradients provided for any variable: ['rel_bases:0', 'rel_shapes:0', 'rel_multiples:0', 'base_weight_ent_emb:0', 'bump_weight_ent_emb:0', 'ent_emb:0', 'ent_emb_bmp:0'].

问题相关代码，请勿粘贴截图

class BoxE:
    def __init__(self, params, corpus_type, work_dir):
        self.params = params
        self.alpha = params.alpha
        self.num_rel = 1
        self.bounded_norm = params.bounded_norm
        self.normed_bumps = params.normed_bumps
        self.fixed_width = params.fixed_width
        self.hard_size = params.hard_size
        self.total_size = params.total_size
        self.learnable_shape = params.learnable_shape
        self.corpus_type = corpus_type
        self.cwd = work_dir
        self.word_vectors = np.load(
            f"{self.cwd}/../../word_vectors_processed/{self.corpus_type}_word_vectors_processed.npy"
        )

    def create_optimizer(self):
        self.loss = -1 * tf.math.reduce_mean(
            input_tensor=tf.math.log_sigmoid(self.params.gamma - self.pos_dissims)
        ) - tf.math.reduce_mean(
            input_tensor=tf.math.log_sigmoid(self.neg_dissims - self.params.gamma)
        )
        pprint("type of loss:{}".format(type(self.loss)))
        self.optimizer = tf.keras.optimizers.Adam(
            self.params.learning_rate
        ).minimize(self.loss, self.var_list, tape=tf.GradientTape())            #报错的代码    

    def create_train_model(self):
        self.pos_h_points = tf.expand_dims(self.ph_base_emb + self.pt_bump_emb, 1)
        self.pos_t_points = tf.expand_dims(self.pt_base_emb + self.ph_bump_emb, 1)

        self.neg_h_points = tf.expand_dims(self.nh_base_emb + self.nt_bump_emb, 1)
        self.neg_t_points = tf.expand_dims(self.nt_base_emb + self.nh_bump_emb, 1)

        self.pos_points = tf.math.tanh(
            tf.concat([self.pos_h_points, self.pos_t_points], 1)
        )
        self.neg_points = tf.math.tanh(
            tf.concat([self.neg_h_points, self.neg_t_points], 1)
        )
        #### concat dimension is batch*2*100 ####
        self.pos_dissims = self.distance_function(self.pos_points)
        self.neg_dissims = self.distance_function(self.neg_points)

    def gather_train_embeddings(self, ph:tf.int32, pt:tf.int32, nh:tf.int32, nt:tf.int32, r:tf.int32):
        temp = tf.matmul(self.ent_emb, self.base_weight_ent_emb)
        self.ph_base_emb = tf.gather(temp, ph)
        self.pt_base_emb = tf.gather(temp, pt)
        self.nh_base_emb = tf.gather(temp, nh)
        self.nt_base_emb = tf.gather(temp, nt)

        temp1 = tf.matmul(self.ent_emb_bmp, self.bump_weight_ent_emb)
        if self.normed_bumps:  # Normalization of bumps option
            temp1 = tf.math.l2_normalize(temp1, axis=1)

        self.ph_bump_emb = tf.gather(temp1, ph)
        self.pt_bump_emb = tf.gather(temp1, pt)
        self.nh_bump_emb = tf.gather(temp1, nh)
        self.nt_bump_emb = tf.gather(temp1, nt)

        self.rel_bases_emb = tf.math.tanh(tf.gather(self.rel_bases, r))
        self.rel_deltas_emb = tf.math.tanh(tf.gather(self.rel_deltas, r))

    @tf.function
    def optimize(self):
        for itr in range(0, self.params.max_iterate + 1):
            total_loss = 0.0

            for b in range(self.num_batch):

                ph, pt, nh, nt, r = self.reader.next_batch()

                self.gather_train_embeddings(ph, pt, nh, nt, r)
                self.create_train_model()
                self.create_optimizer()

                total_loss += self.loss

            if math.isnan(total_loss):
                break
            print("Loss in iteration", itr, "=", total_loss)

            if itr % self.params.save_each == 0 and itr >= self.params.save_after:
                self.save_model(itr)
                print("done saving model")

    def setup_weights(self):
        sqrt_size = 6.0 / math.sqrt(self.params.emb_size)

        self.ent_emb = tf.Variable(self.word_vectors, dtype=tf.float32, name="ent_emb")
        self.ent_emb_bmp = tf.Variable(
            self.word_vectors, dtype=tf.float32, name="ent_emb_bmp"
        )

        self.base_weight_ent_emb = tf.Variable(
            name="base_weight_ent_emb",
            initial_value=tf.random.uniform(
                # shape=[300, self.params.emb_size], minval=-sqrt_size, maxval=sqrt_size
                shape=[400, self.params.emb_size], minval=-sqrt_size, maxval=sqrt_size
            ),
        )
        self.bump_weight_ent_emb = tf.Variable(
            name="bump_weight_ent_emb",
            initial_value=tf.random.uniform(
                # shape=[300, self.params.emb_size], minval=-sqrt_size, maxval=sqrt_size
                shape=[400, self.params.emb_size], minval=-sqrt_size, maxval=sqrt_size

            ),
        )

        if self.learnable_shape:  # If shape is learnable, define variables accordingly
            self.rel_shapes = tf.Variable(
                name="rel_shapes",
                initial_value=tf.random.uniform(
                    shape=[self.num_rel, 2, self.params.emb_size],
                    minval=-sqrt_size,
                    maxval=sqrt_size,
                ),
            )
            self.norm_rel_shapes = self.product_normalise(
                self.rel_shapes, self.bounded_norm
            )
        else:
            self.norm_rel_shapes = tf.ones(
                [self.num_rel, 2, self.params.emb_size], name="norm_rel_shapes"
            )

        self.rel_bases = tf.Variable(
            name="rel_bases",
            initial_value=tf.random.uniform(
                shape=[self.num_rel, 2, self.params.emb_size],
                minval=-sqrt_size,
                maxval=sqrt_size,
            ),
        )

        if self.fixed_width:
            self.rel_multiples1 = tf.zeros([self.num_rel, 2, 1])
        else:
            self.rel_multiples1 = tf.Variable(
                name="rel_multiples",
                initial_value=tf.random.uniform(
                    shape=[self.num_rel, 2, 1], minval=-sqrt_size, maxval=sqrt_size
                ),
            )

        if self.hard_size:
            self.rel_multiples = self.total_size * tf.nn.softmax(
                self.rel_multiples1, axis=0
            )
        else:
            self.rel_multiples = tf.nn.elu(self.rel_multiples1) + tf.constant(1.0)

        self.rel_deltas = tf.multiply(
            self.rel_multiples, self.norm_rel_shapes, name="rel_deltas"
        )

        self.var_list = [
            self.rel_bases,
            self.rel_shapes,
            self.rel_multiples1,
            self.base_weight_ent_emb,
            self.bump_weight_ent_emb,
            self.ent_emb,
            self.ent_emb_bmp,
        ]

    def setup_reader(self):
        self.reader = Reader(self.corpus_type)
        self.reader.read_triples()
        self.reader.set_batch_size(self.params.batch_size)
        self.reader.set_neg_samples(self.params.no_neg_samples)
        self.num_batch = self.reader.num_batch()
        self.num_ent = self.reader.num_ent()

    def product_normalise(self, input_tensor, bounded_norm=True):
        step1_tensor = tf.abs(input_tensor)
        step2_tensor = step1_tensor + (10 ** -8)
        log_norm_tensor = tf.math.log(step2_tensor)
        step3_tensor = tf.reduce_mean(input_tensor=log_norm_tensor, axis=2, keepdims=True)
        norm_volume = tf.math.exp(step3_tensor)
        pre_norm_out = input_tensor / norm_volume
        if not bounded_norm:
            return pre_norm_out
        else:
            minsize_tensor = tf.minimum(
                tf.reduce_min(input_tensor=log_norm_tensor, axis=2, keepdims=True), -1
            )
            maxsize_tensor = tf.maximum(
                tf.reduce_max(input_tensor=log_norm_tensor, axis=2, keepdims=True), 1
            )
            minsize_ratio = -1 / minsize_tensor
            maxsize_ratio = 1 / maxsize_tensor
            size_norm_ratio = tf.minimum(minsize_ratio, maxsize_ratio)
            normed_tensor = log_norm_tensor * size_norm_ratio
            return tf.exp(normed_tensor)

    def distance_function(self, points):
        self.rel_bx_low, self.rel_bx_high = self.compute_box(
            self.rel_bases_emb, self.rel_deltas_emb
        )
        lower_corner = self.rel_bx_low
        upper_corner = self.rel_bx_high
        centres = 1 / 2 * (lower_corner + upper_corner)

        widths = upper_corner - lower_corner
        widths_p1 = widths + tf.constant(1.0)
        width_cond = tf.compat.v1.where(
            tf.logical_and(lower_corner <= points, points <= upper_corner),
            tf.abs(points - centres) / widths_p1,
            widths_p1 * tf.abs(points - centres)
            - (widths / 2) * (widths_p1 - 1 / widths_p1),
        )
        distance = tf.norm(
            tensor=width_cond, axis=2, ord=self.params.p_norm
        )  ###batch*2*1 after norm
        distance = tf.reduce_sum(input_tensor=distance, axis=1)

        return distance

    def save_model(self, itr):
        # filename = (
        #     f"{self.cwd}/BoxModel_"
        #     + self.corpus_type
        #     + "_weights/"
        #     + str(itr)
        #     + ".ckpt"
        # )
        filename = "all_trained_models"
        if not os.path.exists(os.path.dirname(filename)):
            os.makedirs(os.path.dirname(filename))
        tf.saved_model.save(self, filename)
        tf.keras.models.save_model(filename, save_format='tf')

    def compute_box(self, box_base, box_delta):
        box_second = box_base + tf.constant(0.5) * box_delta
        box_first = box_base - tf.constant(0.5) * box_delta
        box_low = tf.minimum(box_first, box_second, "box_low")
        box_high = tf.maximum(box_first, box_second, "box_high")
        return box_low, box_high

我的解答思路和尝试过的方法

网上搜了一下，基本上这个错误是因为loss的计算跟var_list里面的可训练参数没有关系，导致梯度不能传递:
https://blog.csdn.net/M1ddle/article/details/106387040?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.pc_relevant_default&utm_relevant_index=2
但是我检查了代码，就我看到的，loss的确是由var_list里的可训练参数一步步直接或间接计算得到的，不知道问题出在哪。

我想要达到的结果

正常传递梯度，正常进行Adam优化

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不会长胖的斜杠后端领域新星创作者 2022-04-25 10:55
关注
你可以换成tensorfolw 2.0试试

本回答被专家选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在虚拟环境中成功安装TensorFlow后还是出现不能读取的问题 python tensorflow
2022-12-17 22:30

回答 6 已采纳如果在 Anaconda 虚拟环境中已经成功安装 TensorFlow，但仍然出现了 ModuleNotFoundError: No module named 'tensorflow' 的错误消息，可
如何安装vue脚手架cli？ vue.js
2022-07-14 19:25

回答 2 已采纳你这个已经成功了吧。vue -v 。还有你要安装 vue 2还是3 他俩命令不一样安装 | Vue.js Vue.js - The
若依框架springcloud 配置swagger 出现java.lang.NoSuchMethodError: java spring cloud 后端
2021-11-09 12:09

回答 1 已采纳试一下，把配置文件swagger：改为 swagger：‘2.0’
tensorflow2.5.0-GPU测试工程
2022-07-27 17:43

在ubuntu16.04上编译好tensorflow2.5.0-GPU；使用的是RTX 2060 Super测试多张图片；比TF-CPU加速很多。
PHP致命错误：仅在eclipse中调用未定义的函数json_decode（） eclipse php ubuntu
2016-04-26 09:00

回答 3 已采纳 Finally, I found the problem is I have installed two PHP somehow. So after I uninstall one of them
Nginx阻止文件上传到静态页面：405 Not Allowed nginx php
2014-08-26 13:11

回答 1 已采纳 The problem turned out to be that I had put directives from the http_mp4_module in the location /
DateTime :: diff year不起作用 php
2014-12-01 18:42

回答 1 已采纳 Change your = in your conditions to == (all) Otherwise you make a assignment and the last one is
Tensorflow2.5.0安装中常见的问题及解决方法
2021-09-14 14:46

遗落星球的博客安装Tensorflow2.5.0:需要指定版本，并指定cpu还是gpu版本。非源码安装后，调用会产生警告。参考： https://blog.csdn.net/weixin_43159148/article/details/89609870 完毕后，验证，tensorflow1和2版本相差较大，...
Composer / Laravel：如何添加/更新特定包 laravel php
2014-06-12 03:06

回答 2 已采纳 I tried the following and it seemed to work for me. You'll have to first add barryvdh/laravel-dom
在win10启动kafka报错 kafka zookeeper
2022-05-15 21:27

回答 1 已采纳删除异常的主题“movie_real_topic”试试.\bin\kafka-topics --delete --topic movie_real_topic --zookeeper localhos
PHP致命错误：调用未定义的函数json_decode（） apache json php ubuntu
2013-08-14 18:24

回答 9 已采纳 Using Ubuntu? Short answer: sudo apt-get install php7.2-json (or php7.1-json or php5-json dep
安装tensorflow2.5.0
2022-02-13 10:13

onerobo的博客 1.安装anacoda 2.安装对应的cuda、cudnn 3.安装tensorflow。前两部教程很多window10上通过Anaconda安装...我本意是安装tensorflow2.5.0，python3.6版本的。然后参考网上很多教程，第一步，创建conda的虚拟环
PHP致命错误：PHP 5.5中找不到类'Curl' php
2014-01-13 14:38

回答 3 已采纳 According to the documentation there is no class Curl. Perhaps you forgot to import some class o
对应的TensorFlow2.5.0+Keras2.5.0版本及测试是否可用
2023-06-06 11:20

山山而川_R的博客对应的TensorFlow2.5.0+Keras2.5.0版本。3.查看tensorflow版本。安装完成总结测试可用的版本号。2.查看theano版本。1.查看keras版本。
tensorFlow2.5.0+windows-cpu的dll和lib
2022-04-12 14:43

tensorFlow2.5.0+windows-cpu的dll和lib
tensorflow 2.5.0 ( keras )搭建wgan-gp 和 div
2022-01-05 17:31

机器人学渣的博客使用tensorflow 2.5.0搭建wgan网络：代码： import argparse from inspect import classify_class_attrs import tensorflow as tf import tensorflow.keras as K import numpy as np import cv2 as cv import os ...
tensorboard报错：ValueError Duplicate plugins for name projector 问题的出现及解决过程
2022-03-05 11:31

Adenialzz的博客 tensorboard报错：ValueError: Duplicate plugins for name projector 问题的出现及解决过程记录如题问题的出现及解决过程。报错命令及信息笔者在终端调用 tensorboard 时： tensorboard --logdir=runs/ --bind_...
tensorflow_gpu2.5.0版本3.rar
2021-06-21 17:51

tensorflow_gpu2.5.0版本3.8whl
Keras自定义损失函数出现：ValueError: Unknown loss function: focal_loss
2022-07-12 15:53

任博啥时候能毕业？的博客 glob, loc) File "E:/Code/Python/tensorflow2.5.0/Classification model evaluation/model_evaluation.py", line 70, in <module> model = load_model(model_path) File "C:\Users\Admin\Anaconda3\envs\tf2.3\lib...
win10系统cpu版本 Tensorflow2.5.0的安装
2023-05-16 19:27

小桥流水---人工智能的博客文章目录前言电脑重装系统了，顺便简单记录一下我的tensorflow==2.5.0 CPU的安装过程一、创建一个虚拟环境？二、确定输入 y 三、激活你的环境四、安装tensorflow==2.5.0 五、利用清华镜像源加速一下，不然等到...
没有解决我的问题, 去提问