怎样用Q_learning在回测中更新softmax分类器的系数？

我分析的目标分类随时间的变化各参数的系数会产生变化，比如，用softmax对孩子的健康水平进行分类。随时间的变化，同龄孩子的体重会逐渐偏高，需要用强化学习把体重情况和孩子的健康情况的系数进行更新。
目前，我是随着时间的变化每次测试中重建机器学习框架，重新生成一套系数，但是这样系数变化会比较大，我需要利用强化学习把这个系数变化做得更平滑一些，求大神指教（请根据以下代码进行添加和修改，我看了很多强化学习的案例，还是不知道怎么应用在这里）。

w=[]
u=[]
for lenth in range (5,training_lenth-1):
x=tf.placeholder("float", [None,25])
y=tf.placeholder("float", [None,2])
W=tf.Variable(tf.zeros([25,2]))
b=tf.Variable(tf.zeros([2]))

actv= tf.nn.softmax(tf.matmul(x,W)+b)
cost=tf.reduce_mean(-tf.reduce_sum(y*tf.log(actv), reduction_indices=1))
learning_rate=0.01
optm= tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
pred=tf.equal(tf.argmax(actv, 1), tf.argmax(y, 1))
accr=tf.reduce_mean(tf.cast(pred,"float"))
init=tf.global_variables_initializer()
sess=tf.InteractiveSession()
sess=tf.Session()
sess.run(init)
training_lenth=len(G)####(回测长度）
training_epochs =500 #训练次数
batch_size = len(G) #每
for epoch in range(training_epochs):
avg_cost=0
num_batch=int(len(G)/batch_size)
for i in range((lenth-4),lenth):
batch_xs=np.array(G[i])
batch_ys=np.array(F[i])
sess.run(optm, feed_dict={x: batch_xs, y: batch_ys})
feeds={x:batch_xs, y: batch_ys}
avg_cost += sess.run (cost, feed_dict=feeds)/(num_batch*lenth)
feeds_train = {x: batch_xs, y: batch_ys}
feeds_test = {x: G[i+1], y: F[i+1]}
train_acc = sess.run(accr, feed_dict=feeds_train) #feed_dict 针对place holder占位
test_acc = sess.run(accr,feed_dict=feeds_test)
w.append(test_acc)
u.append(train_acc)
result=sess.run(actv,feed_dict=feeds_test)
print(result)
print ("lenth: %03d/%03d cost: %.9f train_acc: %.3f test_acc: %.3f" % (lenth, training_epochs, avg_cost, train_acc, test_acc))#打印方法

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

softmax分类器，分类概率都是nan是怎么回事？ python
2018-04-13 07:14

回答 3 已采纳你的测试准确率有问题，还不如随机分类的准确率，你在看一下。出现nan的原因可能是：真是label为[1,0]，预测的label是[0,1]，这样反向传播的weight和bias会无穷大，可能的解决
多分类softmax问题使用binary_crossentropy tensorflow 人工智能机器学习深度学习神经网络
2020-05-26 15:57

回答 1 已采纳不知道你什么结果高很多，是loss高，还是acc高。一南一北两回事了。
softmax在代码的哪里？ python 深度学习计算机视觉
2023-04-16 09:18

回答 2 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7649031这篇博客也不错, 你可以看下softmax pytorch从零实现的代码除此之外, 这
梯度下降法求解回归问题.rar_sky8gx_softmax _softmax分类器_softmax回归_回归问题
2022-07-13 23:41

使用SOFTMAX分类器对已有的数据集进行分类
使用tensorflow时在 '__init__.py' 中找不到引用 python tensorflow 机器学习
2021-05-03 17:32

回答 1 已采纳我把你的代码拿到本地跑了，首先你的代码的API是TF1.x版本的，我本地用的是tf1.15，所以第一步是把TF切换到1.15(我测试通过了，看你用Anaconda，那么安装就很简单了conda ins
pycharm运行代码出现“在 '__init__.pyi' 中找不到引用” pycharm python tensorflow
2022-05-25 20:36

回答 2 已采纳 contrib已经在Tensorflow2.x弃用了，要么换1.x的版本，要么改代码，具体还需要去查一下这个api在2.x版本变成什么了，麻烦的很，早转pytorch早轻松
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
MLP分类_softmax分类器_keras_神经网络_establishjop_分类_
2021-10-03 06:56

使用keras架构基于多层感知器的二分类，softmax 多分类。
softmax之后值不在0-1之间是为什么 pytorch 深度学习
2023-02-25 22:21

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵsoftmax函数是用于将输入转换为概率分布的函数。在输出结果中，每个元素都应该是介于0到1之间的值。但是，由于计算机内部浮点数的精度问题，在使用softmax函数时可能会
softmax不知道哪里写错了，二分类预测的正确率为0.1左右。不知道哪里反了 python 深度学习神经网络
2022-07-27 18:30

回答 1 已采纳很明显你训练的时候标注的和验证时标注的是反的调整一下就可以了 0 看做1 1 看做0 就好
softmax到底该怎么使用 cnn python 深度学习
2022-12-10 13:34

回答 1 已采纳望采纳在深度学习中，softmax函数是一种常用的分类函数，它可以将输入的多个数值映射到一个0到1之间的概率分布。通常，在神经网络中，softmax函数会被用作输出层的激活函数，用来对多分类问题进行预
Softmax分类器
2021-01-20 02:18

Softmax 函数用于多分类，他将多个神经元的输出的值映射到（0,1）区间内的一个值，，并且映射的所有值相加为1，这些值可以理解为输出的概率，输出概率较大的一般作为预测的值计算公式分子：fyi 表示第i个类别指数...
用pytorch写了一个经典的鸢尾花分类 pytorch 分类机器学习
2022-10-25 10:18

回答 2 已采纳尝试把batch size调小，或者学习率调小点试试。
code_softmax_Softmax鸢尾花_machinelearning_
2021-09-28 19:32

使用softmax解决三分类问题，梯度下降法，数据集为鸢尾花数据集。
softmax分类器_DeepLearning.ai 学习笔记(六)Softmax分类器和程序框架
2020-11-23 13:49

weixin_39828193的博客这一节主要介绍第二章中的Softmax 分类器以及程序框架的相关内容。一、Softmax 回归到目前为止，我们讲到过的分类的例子都使用了二分分类，这种分类只有两种可能的标记0或1，这是一只猫或者不是一只猫，如果我们有...
没有解决我的问题, 去提问

悬赏问题

¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突

码龄粉丝数原力等级 --

怎样用Q_learning在回测中更新softmax分类器的系数？

0条回答默认最新

悬赏问题

怎样用Q_learning在回测中更新softmax分类器的系数？

0条回答 默认 最新

悬赏问题

0条回答默认最新