1条回答 默认 最新
- 黑狗儿 2023-03-25 16:14关注
第一步:模仿学习;向AI展示一个庞大的超过9000帧来自玩家的游戏数据,他们会试图分析模仿;
第二步:强化学习;把AI小人扔进一个虚拟的游戏世界,让他们通过反复的实验来发现和解决问题;
例如AI学会下围棋,最初就是通过输入游戏数据它们掌握了规则,然后一遍又一遍的模拟,当上亿万次模拟之后,无数的可能性被AI记住,那个时候它就超越了所有的人类。
就是这样做的啊。(参考https://baijiahao.baidu.com/s?id=1653855220945970792&wfr=spider&for=pc)
解决 无用评论 打赏 举报
悬赏问题
- ¥15 素材场景中光线烘焙后灯光失效
- ¥15 请教一下各位,为什么我这个没有实现模拟点击
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
- ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
- ¥20 有关区间dp的问题求解
- ¥15 多电路系统共用电源的串扰问题
- ¥15 slam rangenet++配置
- ¥15 有没有研究水声通信方面的帮我改俩matlab代码
- ¥15 ubuntu子系统密码忘记
- ¥15 保护模式-系统加载-段寄存器