运用DQN模型，训练五子棋ai，加入五子棋程序后无法学习。

我构建了一个DQN网络下五子棋，在进行AI博弈的时候发现AI的自我博弈虽然能使AI获得奖励但是在几千轮循环后网络还是无法做到有效的攻防（有目的的连接棋子，或者打断另一方五子相连）。
所以我引入了一个下五子棋的程序（通过评分差值下五子棋实现攻防），但是在引入程序后也不知道是程序太强还是里面的的随机性太大，导致在约7500次左右（训练次数是2w但是我看7500多次都没训练成功我就关掉了）的的训练中程序总能在5到16回合内KO掉DQN网络只也就导致了五子棋AI根本就得不到奖励，无法获得学习。
我的奖励是下棋：0分
获得胜利：1000分
范围超过或者平局-20分
请问大佬们，我要怎么做才能使这个网络实现有效的攻防和学习。
还有就是我用tensorboard的时候发现我的主网络和记忆库的的权重都未发生更新，请问有懂行的大佬知道吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

强化学习DQN:AttributeError: 'CartPoleEnv' object has no attribute 'seed' python pytorch 深度学习
2022-09-15 12:25

回答 2 已采纳你把gym换成0.25.2版本就行了。 pip install gym==0.25.2
如何快速掌握深度强化学习的各种算法，比如DQN，DDPG，PPO，SAC等等，并用Python准确实现呢？？ python pytorch 机器学习
2023-02-11 18:41

回答 1 已采纳以下答案引用自GPT-3大模型,请合理使用： ```想请问大神们，有没有比较好的资料或者指导方法，能够快速掌握深度强化学习的各种算法呢？首先，你需要理解深度强化学习的基本概念。然后，你可以通过阅读相
请各位大神帮帮忙,因为这是毕业论文所用的代码,我想问问到底是否是对的,看看是我代码错了,还是逻辑错了 python 人工智能有问必答机器学习
2021-03-15 15:12

回答 4 已采纳应该是没有读取进来数据。在getstate函数里，for循环没有运行，所以state是None。也可能len(block)刚好等于1，而你又用len(block)-1,所以循环没有进行。我不知道你是不
人工智能_项目实践_强化学习_基于强化学习的五子棋
2022-04-03 22:45

人工智能_项目实践_强化学习_基于强化学习的五子棋
各位大神，想请各位帮我问一问，到底该如何将xlsx数据加入数组 python 有问必答机器学习
2021-03-18 10:05

回答 10 已采纳直接用pandas库来读就行 import pandas as pd data = pd.read_excel('文件名称',sheet_name='表单名称') stockData = list
神经网络能否不失一般性地解图的最短路径问题？机器学习神经网络
2018-12-12 04:37

回答 1 已采纳已找到，使用图网络模型可以实现。
Golang：xml解组无法正常工作 xml
2017-06-05 08:39

回答 1 已采纳 The problem here is that you are using attr where you shouldn't. You are treating the XMLEntry an
人工智能大作业基于python实现五子棋游戏源码(含棋子识别+搜索算法+ANN棋局评估+DQN的棋力提升).zip
2023-08-10 10:58

人工智能大作业基于python实现五子棋游戏源码(含棋子识别+搜索算法+ANN棋局评估+DQN的棋力提升).zip 1、该资源内项目代码都是经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关...
运行roscore出现ModuleNotFoundError: No module named error linux
2022-11-09 15:31

回答 2 已采纳这是由于python版本过多导致的，打开终端第一行输入以下代码即可 !/user/bin/env python<你的版本ROS使用>
python用openpyxl保存excel时出现OSError: [Errno 9] Bad file descriptor，如何解决？ python
2022-08-11 21:07

回答 2 已采纳代码本身测试：这个代码在本地新建环境下使用是正常的错误解析： OSError: [Errno 9] Bad file descriptor Bad file descriptor 错误的文件描述符
各位大神好，请帮我看看以下这个问题可以吗？解决不了 python
2021-02-07 19:15

回答 5 已采纳还有你循环中 table.col_values(5,0,row_num) 每次获取0到row_num行的列表，获取数据重复了啊。是不是应该改为 table.cell_value(row_nu
python_强化学习算法DQN_玩五子棋游戏
2021-03-14 14:24

AI信仰者的博客本文公开一个基于强化学习算法DQN的五子棋游戏自动下棋算法源码，并对思路进行讲解。源码地址： python_强化学习算法DQN_玩五子棋游戏一个基于CNN构成的DQN算法的8*8的五子棋游戏 1、Q-Learning介绍 Q-Learning的...
mat 1 and mat2 shapes cannot be multiplied （1*4 and 6*50) python
2022-10-27 10:42

回答 1 已采纳是的，把6改成4
对抗 DQN 网络 Adversarial-DQN”以及 MCTS 的结合设计AI五子棋系统
2023-01-16 13:23

甜辣uu的博客对抗 DQN 网络 Adversarial-DQN”以及 MCTS 的结合设计AI五子棋系统
基于强化学习的五子棋算法设计-python代码完整实现
2021-03-17 21:33

此课程设计通过五子棋算法设计，加深对机器学习中强化学习概念的理解与应用。本次课程设计的任务如下： 1. 给出“自己与自己程序的对抗”的视频，给自己的棋盘加上自己特有的标签，作为你自己程序的论证（防抄袭），...
没有解决我的问题, 去提问

悬赏问题

¥15 树莓派与pix飞控通信
¥15 自动转发微信群信息到另外一个微信群
¥15 outlook无法配置成功
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题

码龄粉丝数原力等级 --

运用DQN模型，训练五子棋ai，加入五子棋程序后无法学习。

0条回答默认最新

悬赏问题

运用DQN模型，训练五子棋ai，加入五子棋程序后无法学习。

0条回答 默认 最新

悬赏问题

0条回答默认最新