神经网络输出多维向量的值都一样是什么问题呀

最近在用DDPG算法解决无人机的轨迹优化问题遇到了个问题——神经网络不管输入是什么输出都一模一样不变
结果一直是（0.5 0.5 0.5 0.5）（输入数据维度是46 输出是4）
研究了好多天了减少神经元数量，改变优化器、损失函数种类，降低输入维度都试过啦还是不行实在是不知道问题出在哪里啦有知道的可以帮忙解决一下嘛谢谢大家啦！

这是actor神经网络的模型：

class ActorNetwork(object):
    """
    Implements actor network
    """
    def __init__(self,sess,state_dim,action_dim,lr,tau):
        self.sess = sess
        K.set_session(sess)
        K.set_learning_phase(1)
        self.state_dim = state_dim
        self.action_dim = action_dim
        self.lr = lr
        self.tau = tau
        self.mainModel, self.mainModel_weights, self.mainModel_state = self._build_model()
        self.targetModel, self.targetModel_weights, _ = self._build_model()
        self.action_gradient = tf.placeholder(tf.float32, [None, self.action_dim])
        self.params_grad = tf.gradients(self.mainModel.output, self.mainModel_weights, -self.action_gradient)
        grads = zip(self.params_grad, self.mainModel_weights)
        self.optimize = tf.train.AdamOptimizer(self.lr).apply_gradients(grads)
        self.sess.run(tf.global_variables_initializer())
 
    def _build_model(self):
        input_obs = Input(shape=(self.state_dim,))  # 输入层 返回一个维度为self.state_dim的张量
        h = BatchNormalization()(input_obs)
        h = Dense(400, kernel_initializer = 'random_uniform')(h)  # 全连接层 400个神经元（即该层的输出维度）
        h = LeakyReLU(alpha=0.1)(h)
        h = Dense(300, kernel_initializer = 'random_uniform')(h)  # 全连接层 输出维度300
        h = LeakyReLU(alpha=0.1)(h)
        h = Dense(self.action_dim, kernel_initializer = 'random_uniform')(h)  # 全连接层 输出维度self.action_dim
        h = Activation('tanh')(h)  # softmax 改为 tanh
        pred = Lambda(lambda h: (h+1)/2)(h)
 
        # RelaxedOneHotCategorical() 函数的作用？？？ 网络最终输出结果的范围？？？
        # pred = Lambda(lambda h: tf.contrib.distributions.RelaxedOneHotCategorical(0.5, probs=h).sample())(h)
 
        # 给定输入张量和输出张量 生成一个函数型模型 这里包括一个输入层和3个全连接层
        model = Model(inputs=input_obs, outputs=pred)
 
        # 用于配置训练模型 优化器：Adam 损失函数：categorical_crossentropy
        model.compile(optimizer='Adam'(), loss='categorical_crossentropy')
 
        return model, model.trainable_weights, input_obs
 
    def act(self, state):
        act = self.mainModel.predict(state)
        return act

这是使用该神经网络获取动作值的部分：


```python
        for stp in range(int(args['max_episode_len'])):
            a = []
            for i in range(env.num_UAVs):
                actor = actors[i]
                a.append(actor.act(np.reshape(s[i], (-1, actor.state_dim))).reshape(actor.action_dim, ))  # 输入状态 输出动作
                # reshape 在不改变数据内容的情况下，改变一个数组的格式
                # (-1,actor.state_dim) 表示将智能体i的状态信息转化为列数为actor.state_dim的矩阵 行数自适应
                # 输入到actor网络的输出结果（动作）再reshape为行数为actor.action_dim的矩阵
 
            for i in range(env.num_UAVs):
                # 增加探索扰动, 输出限制在 [0, 1] 范围内
                a[i] = np.clip(np.random.normal(a[i], NOISE), 0, 1)
 
            s2, r, done = env.step(a)
            replayMemory.add(s, a, r, done, s2)
            s = s2

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
人生取材 2023-02-19 11:41
关注
检查输入数据是否正确：确保您的输入数据已经被正确地预处理和标准化，使其能够适应网络的要求。还要确保您的输入数据与您的问题域相匹配。

检查网络结构：确认您的神经网络结构是否正确并满足您的问题要求。特别是在使用DDPG算法时，Actor网络通常采用全连接网络或卷积神经网络。您可以尝试增加或减少网络的深度和宽度，以看看是否有任何改善。

检查超参数：确保您的优化器和学习率等超参数已正确设置，尝试使用其他优化器和学习率值，观察是否会对网络性能产生影响。

检查目标函数和奖励函数：请确保您的目标函数和奖励函数与您的问题域相匹配，同时考虑使用不同的目标函数和奖励函数来比较其性能。

调试代码：检查您的代码是否存在错误，可能有语法错误或者实现有误。

如果以上方法都没有解决问题，您可能需要深入分析问题所在，比如可视化激活层的输出和权重，来查找问题的根源。

至于您提供的Actor神经网络的模型，我发现它使用了ReLU激活函数，这是一个常用的激活函数，但在某些情况下可能会导致梯度消失的问题。您可以尝试使用其他激活函数，例如LeakyReLU或ELU，看看是否有任何改善。此外，您的输出层使用了tanh激活函数，这意味着输出值将始终在-1和1之间。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

神经网络输出多维向量的值都一样是什么问题呀 python 机器学习神经网络
2023-02-19 11:33

回答 2 已采纳检查输入数据是否正确：确保您的输入数据已经被正确地预处理和标准化，使其能够适应网络的要求。还要确保您的输入数据与您的问题域相匹配。检查网络结构：确认您的神经网络结构是否正确并满足您的问题要求。特别是
神经网络输出的多维向量的值总感觉怪怪的 python 机器学习神经网络
2023-02-20 17:11

回答 2 已采纳你是用什么数据训练你的模型？看输出结果都是 0.5，似乎模型根本就没有训练。
python求多维向量余弦值 python
2022-09-16 03:58

回答 2 已采纳计算结果远大于1还是非常接近于1？如果是后者，我猜可能是浮点数累计误差造成的。计算向量余弦的算法，貌似是正确的，但代码有很多值得商榷之处，比如： python内置pow函数，无需从math导入；pyt
基于MATALB 编程的支持向量机SVM分类，代码详细注释
2023-04-08 06:15

支持向量机（Support Vector Machine，SVM）是一种强大的机器学习算法，广泛应用于分类和回归问题。在MATLAB中实现SVM分类，可以利用其内置的统计和机器学习工具箱，使得模型训练和理解变得更加简单。本文将详细介绍...
基于python的ANN多输出回归问题，应该如何处理输入数据和选择损失函数呢？ python 回归有问必答神经网络
2022-05-12 19:50

回答 1 已采纳你的输入特征之间，存在明显的量级差别，最好进行归一化；输出也是，直接使用mse作为loss，两个输出的比重会差很多
创建并输出一个多维数组 python
2022-03-03 09:52

回答 1 已采纳 data_list = [] for i in range(10): user = input("创建用户，输入用户名") items = [n for n in input("输入1
实现将堆栈数据赋值给多维数组，但输出的第一行都是堆栈的第一个值，请问是哪里出错了呢？ c++ 有问必答问答团队
2021-05-22 16:12

回答 4 已采纳那肯定是第一个值啊，你在堆栈循环里面套双循环，双循环里每次都是把堆栈的当前值进行赋值，这个值一直没改变啊 int i=0,j=0; for (it = V.begin(); it != V.end
数据统计分析及R语言编程
2024-01-12 21:31

在机器学习和人工智能领域，R语言也有众多库可供选择，如caret用于训练和评估模型，randomForest和xgboost用于构建决策树和梯度提升模型，neuralnet和keras则支持神经网络的构建。最后，R语言有一个庞大的社区和...
C#中的一组数组如何输出最大值和最小值的下标 c# 有问必答
2021-05-24 15:01

回答 3 已采纳 static void Main(string[] args) { int xb = 0; int[] sZInt = new int
Clion调试时如何查看多维数组元素值 c语言
2022-11-11 15:40

回答 1 已采纳 C语言中，二维数组的指针需要知道每行有多少个元素，这样指针在++的时候才能知道要跨过多少个字节的内存虽然没有用过CLion，但这里应该是指每行有多少个元素
多维数组一维展开输出，包成函数 python
2023-01-10 19:06

回答 1 已采纳可以使用 Python 的嵌套列表推导 (nested list comprehension) 来生成这样的列表。你可以定义一个函数，接收两个参数，一个是行数 m，另一个是列数 n，然后返回一个嵌
GRNN预测基于广义神经网络GRNN实现数据预测附Python代码和数据集.zip
2023-09-05 12:42

GRNN（Generalized ...通过理解GRNN的工作原理和Python编程，我们可以有效地利用提供的代码和数据集来建立一个数据预测模型，这对于许多实际问题，如时间序列预测、工程领域的参数估计等，都有广泛的应用价值。
Golang中的多维数组
2018-07-29 11:12

回答 3 已采纳 Make a map if the map is nil. For example, package main import ( "fmt" "math" ) func ma
jupyter神经网络ZZZ
2022-05-18 15:32

在Jupyter Notebook中，我们可以方便地使用Python编程语言，配合各种深度学习框架，如TensorFlow、Keras或PyTorch来构建和训练神经网络。下面是一些关键知识点： 1. **Python基础知识**：理解Python的基础语法，...
24.MATLAB神经网络43个案例分析基于SVM的数据分类预测-意大利葡萄酒种类识别.zip
2023-10-04 15:57

在这个主题中，我们关注的是如何使用MATLAB进行神经网络和基于支持向量机（SVM）的数据分类预测，具体案例是意大利葡萄酒种类的识别。这个压缩包包含了一个名为"chapter14"的文件，很可能是一个教程或案例研究的第14...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月19日

悬赏问题

¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同

神经网络输出多维向量的值都一样是什么问题呀

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新