为什么随意定义一个tf.constant（不在任何地方用它）都会造成网络性能下降？

问题遇到的现象和发生背景

为什么PINN的burgers Identification的代码里（可以理解为就一个tf1的神经网络）不管是在网络类里，还是主函数里，还是最外面，定义一个tf.constant（不在任何地方用它）都会造成网络性能下降？

问题相关代码，请勿粘贴截图

import math

import tensorflow as tf
import numpy as np
import time
import matplotlib.pyplot as plt
import Dao

np.random.seed(1234)
tf.set_random_seed(1234)

fig = plt.figure()
ax1 = fig.add_subplot(3, 1, 1)  # 画3行1列个图形的第1个
ax2 = fig.add_subplot(3, 1, 2)  # 画3行1列个图形的第2个
ax3 = fig.add_subplot(3, 1, 3)  # 画3行1列个图形的第3个
ax1.set_xlabel('its')
ax2.set_xlabel('its')
ax3.set_xlabel('its')
ax1.set_ylabel('loss')
ax2.set_ylabel('lamda_1')
ax3.set_ylabel('lamda_2')

data = [[] for i in range(4)]


class PhysicsInformedNN:
    # Initialize the class
    it = 0

    def __init__(self, X, u, layers, lb, ub):
        self.it = self.it + 1

        # scale factor n
        self.n = tf.constant([1], dtype=tf.float32)
        #self.m = tf.constant([1], dtype=tf.float32)

        self.lb = lb
        self.ub = ub

        self.x = X[:, 0:1]
        self.t = X[:, 1:2]
        self.u = u

        self.layers = layers

        # Initialize NNs
        self.weights, self.biases = self.initialize_NN(layers)

        # tf placeholders and graph
        self.sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True,
                                                     log_device_placement=True))

        # Initialize parameters
        self.lambda_1 = tf.Variable([0.0], dtype=tf.float32)
        self.lambda_2 = tf.Variable([-6.0], dtype=tf.float32)
        # hyper-parameter a
        # adaptive activation parameter
        self.a = tf.Variable([1], dtype=tf.float32)

        self.x_tf = tf.placeholder(tf.float32, shape=[None, self.x.shape[1]])
        self.t_tf = tf.placeholder(tf.float32, shape=[None, self.t.shape[1]])
        self.u_tf = tf.placeholder(tf.float32, shape=[None, self.u.shape[1]])

        self.u_pred = self.net_u(self.x_tf, self.t_tf)
        self.f_pred = self.net_f(self.x_tf, self.t_tf)

        self.loss = 0.75 * tf.reduce_mean(tf.square(self.u_tf - self.u_pred)) + \
                    0.25 * tf.reduce_mean(tf.square(self.f_pred))

        self.optimizer = tf.contrib.opt.ScipyOptimizerInterface(self.loss,
                                                                method='L-BFGS-B',
                                                                options={'maxiter': 50000,  # 最大迭代次数
                                                                         'maxfun': 50000,  # 最大函数估计次数
                                                                         'maxcor': 50,
                                                                         'maxls': 50,  # 最大行搜索步骤数
                                                                         'ftol': 1.0 * np.finfo(float).eps})  # 结束时间

        self.optimizer_Adam = tf.train.AdamOptimizer()
        self.train_op_Adam = self.optimizer_Adam.minimize(self.loss)
        # 自适应矩估计优化算法

        init = tf.global_variables_initializer()
        self.sess.run(init)

    def initialize_NN(self, layers):
        weights = []
        biases = []
        num_layers = len(layers)
        for l in range(0, num_layers - 1):
            W = self.xavier_init(size=[layers[l], layers[l + 1]])
            b = tf.Variable(tf.zeros([1, layers[l + 1]], dtype=tf.float32), dtype=tf.float32)
            weights.append(W)
            biases.append(b)
        return weights, biases

    def xavier_init(self, size):
        in_dim = size[0]
        out_dim = size[1]
        xavier_stddev = np.sqrt(2 / (in_dim + out_dim))
        return tf.Variable(tf.truncated_normal([in_dim, out_dim], stddev=xavier_stddev), dtype=tf.float32)

    def neural_net(self, X, weights, biases):
        num_layers = len(weights) + 1
        k = self.n * self.a
        H = 2.0 * (X - self.lb) / (self.ub - self.lb) - 1.0
        for l in range(0, num_layers - 2):
            W = weights[l]
            b = biases[l]
            H = tf.sin(k * tf.add(tf.matmul(H, W), b))
        W = weights[-1]
        b = biases[-1]
        Y = tf.add(tf.matmul(H, W), b)
        return Y

    def net_u(self, x, t):
        u = self.neural_net(tf.concat([x, t], 1), self.weights, self.biases)
        return u

    def net_f(self, x, t):
        lambda_1 = self.lambda_1
        lambda_2 = tf.exp(self.lambda_2)
        u = self.net_u(x, t)
        u_t = tf.gradients(u, t)[0]
        u_x = tf.gradients(u, x)[0]
        u_xx = tf.gradients(u_x, x)[0]
        f = u_t + lambda_1 * u * u_x - lambda_2 * u_xx

        return f

    def callback(self, loss, lambda_1, lambda_2, a):
        data[0].append(self.it)
        data[1].append(loss)
        data[2].append(lambda_1)
        data[3].append(np.exp(lambda_2))
        print('It: %d, Loss: %e, l1: %.5f, l2: %.5f, a:%.5f' % (self.it, loss, lambda_1, np.exp(lambda_2), a))
        self.it = self.it + 1

    def train(self, nIter):
        tf_dict = {self.x_tf: self.x, self.t_tf: self.t, self.u_tf: self.u}

        start_time = time.time()
        for it in range(nIter):
            self.sess.run(self.train_op_Adam, tf_dict)
            # Print
            if it % 10 == 0:
                loss_value = self.sess.run(self.loss, tf_dict)
                lambda_1_value = self.sess.run(self.lambda_1)
                lambda_2_value = np.exp(self.sess.run(self.lambda_2))
                print('It: %d, Loss: %.3e, Lambda_1: %.3f, Lambda_2: %.6f' %
                      (it, loss_value, lambda_1_value, lambda_2_value))
                data[0].append(it)
                data[1].append(loss_value)
                data[2].append(lambda_1_value)
                data[3].append(lambda_2_value)
                self.it += self.it + 1
        self.optimizer.minimize(self.sess,
                                feed_dict=tf_dict,
                                fetches=[self.loss, self.lambda_1, self.lambda_2, self.a],
                                loss_callback=self.callback)
        elapsed = time.time() - start_time
        print('total time:%.2f' % elapsed)

    def predict(self, X_star):

        tf_dict = {self.x_tf: X_star[:, 0:1], self.t_tf: X_star[:, 1:2]}

        u_star = self.sess.run(self.u_pred, tf_dict)
        f_star = self.sess.run(self.f_pred, tf_dict)

        return u_star, f_star


if __name__ == "__main__":
    N_u = 2000
    nu = 0.01 / np.pi
    layers = [2, 20, 20, 20, 20, 20, 20, 20, 20, 1]

    sql_domain = "select x,t,usol from burgers order by t,x"
    result_domain = Dao.loadSql(sql_domain)
    X_star = np.array(result_domain)[:, 0:2]
    u_star = np.array(result_domain)[:, -1]
    u_star = [u_star]
    u_star = np.array(u_star).T

    lb = X_star.min(0)
    ub = X_star.max(0)

    ######################################################################
    ######################## Noiseles Data ###############################
    ######################################################################
    noise = 0.0

    idx = np.random.choice(X_star.shape[0], N_u, replace=False)
    X_u_train = X_star[idx, :]
    u_train = u_star[idx, :]

    model = PhysicsInformedNN(X_u_train, u_train, layers, lb, ub)
    model.train(0)

    u_pred, f_pred = model.predict(X_star)

    error_u = np.linalg.norm(u_star - u_pred, 2) / np.linalg.norm(u_star, 2)

    lambda_1_value = model.sess.run(model.lambda_1)
    lambda_2_value = model.sess.run(model.lambda_2)
    lambda_2_value = np.exp(lambda_2_value)
    result = Dao.insertLamda(
        "update lamda set lamda1=" + str(lambda_1_value[0]) + ",lamda2=" + str(lambda_2_value[0]) + ";")

    error_lambda_1 = np.abs(lambda_1_value - 1.0) * 100
    error_lambda_2 = np.abs(lambda_2_value - nu) / nu * 100

    print('Error u: %e' % (error_u))
    print('Error l1: %.5f%%' % (error_lambda_1))
    print('Error l2: %.5f%%' % (error_lambda_2))

    ax1.plot(data[0], data[1], c="red", label="loss")
    ax2.plot(data[0], data[2], c="blue", label="lamda_1")
    ax3.plot(data[0], data[3], c="green", label="lamda_2")
    plt.savefig("C://Program Files/Apache Software Foundation/Tomcat 8.5/webapps/webserver/imgs/burgers.png")
    # plt.show()

运行结果及报错内容

我的解答思路和尝试过的方法

我猜测过是不是因为tf1的静态图的原因，但是也不现实，毕竟用都没用过

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月10日

悬赏问题

¥15 SPSS分类模型实训题步骤
¥15 求解决扩散模型代码问题
¥15 工创大赛太阳能电动车项目零基础要学什么
¥20 limma多组间分析最终p值只有一个
¥15 nopCommerce开发问题
¥15 torch.multiprocessing.spawn.ProcessExitedException: process 1 terminated with signal SIGKILL
¥15 QuartusⅡ15.0编译项目后，output_files中的.jdi、.sld、.sof不更新怎么解决
¥15 pycharm输出和导师的一样，但是标红
¥15 想问问富文本拿到的html怎么转成docx的
¥15 我看了您的文章，遇到了个问题。

为什么随意定义一个tf.constant（不在任何地方用它）都会造成网络性能下降？

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新